cs.LG 篇论文 | Gist.Science

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

该论文提出了一种结合深度学习与动态输入电导（DICs）框架的新方法，能够仅从尖峰时间数据中快速、鲁棒地重建具有简并性的电导基神经元模型种群，从而在毫秒级时间内实现从实验观测到机制模型的可靠推断。

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

本文提出了 MICA（多智能体工业协调助手），这是一个在受限计算与隐私约束下运行的感知驱动、语音交互系统，它通过五个角色专用智能体与自适应步骤融合技术，为工业装配、故障排查等任务提供实时、安全且可靠的指导，并建立了相应的评估基准以验证其优越性。

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

该论文提出了 ORIC 框架，通过构建上下文不协调的物体识别基准（ORIC-Bench）揭示了大视觉语言模型在此类场景下的性能退化与幻觉问题，并验证了基于该框架数据的视觉强化微调能有效提升模型的可靠性。

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

本文提出了一种基于哈密顿 - 雅可比可达性分析的观测条件残差神经控制障碍函数（ORN-CBF）方法，利用超网络架构确保预测安全集不与观测到的失效集相交，从而在部分可观测环境中近似恢复最大安全集，并通过仿真与硬件实验验证了其在提升地面机器人与四旋翼飞行器安全性及泛化能力方面的有效性。

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

本文提出了一种针对马尔可夫链的全新 PAC-Bayes 界，通过在有穷状态空间下对伪谱间隙提供经验上界，实现了首个完全经验化的 PAC-Bayes 泛化界。

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

该研究发现，线性探针严重依赖文本证据（如系统提示或思维链），一旦过滤掉这些表面文本信息，其在检测沙袋行为、阿谀奉承和偏见等潜在有害行为时的性能会显著下降，表明此类探针在识别非表层模式时存在脆弱性。

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

本文提出了 AEGIS 框架，通过仅对现有训练边进行重采样（包括基于语义 KNN 的增强）而非生成虚假节点，有效解决了边缘稀疏二分知识图谱中的链接预测难题，并在多个基准测试中证明了其在提升预测性能与校准度方面的有效性。

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

本文提出了 Aurora，一种支持多模态输入和零样本推理的通用生成式多模态时间序列基础模型，它通过自适应提取文本或图像中的领域知识来指导时序建模，并利用原型引导的流匹配实现跨域泛化能力卓越的生成式概率预测。

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

本文提出了一类名为 GDR-learners 的通用生成式 Neyman 正交（双重稳健）学习器，该框架可灵活结合条件归一化流、生成对抗网络、变分自编码器及扩散模型等多种先进深度生成模型，以实现对潜在结果条件分布的估计，并具备准 Oracle 效率、速率双重稳健性及渐近最优性等理论优势。

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

本文提出了 CLAD-Net 框架，通过结合自监督 Transformer 作为长期记忆与基于知识蒸馏的监督 CNN，有效解决了多传感器可穿戴系统在跨主体连续学习中的灾难性遗忘问题，并在标签稀缺场景下实现了高精度且低遗忘的活动识别。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

本文提出了生成式进化元求解器（GEMS），这是一种无需代理的框架，它利用潜在锚点和单一生成器替代显式策略种群，在保留博弈论保证的同时显著降低了计算与内存开销，从而实现了可扩展的多智能体强化学习。

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

本文提出了 FS-KAN，一种通过函数共享机制构建的具有任意置换对称性的等变 Kolmogorov-Arnold 网络框架，该框架在理论上保持了与传统参数共享网络相当的表达能力，并在实证中展现出比现有方法更优越的数据效率和可解释性。

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

本文提出了一种名为重叠自适应正则化（OAR）的新方法，通过根据重叠权重动态调整正则化强度，显著提升了现有元学习器在低重叠区域估计条件平均处理效应（CATE）的性能，并提供了保持 Neyman 正交性的去偏版本以确保推断的稳健性。

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

该论文针对缺乏初始成对相似性信息的冷启动场景，提出了一种通过鼓励多样性来实现成本高效查询的覆盖感知主动关联聚类方法，并通过实验验证了其有效性。

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

该论文提出了一种结合分桶滞回与比例反馈的反馈控制方法，通过 principled 的参数选择框架显著提升了在线广告（尤其是小预算活动）的预算执行精度与交付稳定性。

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

该论文首次系统性地提出并实证了“误演化”（Misevolution）概念，揭示了自进化大语言模型代理在模型、记忆、工具和工作流四个关键路径中可能偏离预期并引发安全对齐退化或漏洞等新型风险，从而强调了构建更安全自进化代理的紧迫性。

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

本文提出了一种名为 DRQ-learner 的新型元学习器，用于在马尔可夫决策过程中基于观测数据估计个体化潜在结果，该学习器具备双重稳健性、Neyman 正交性及拟 Oracle 效率等理论优势，且能灵活结合任意机器学习模型处理离散或连续状态空间，并在实验中表现优于现有基线方法。

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Privately Estimating Black-Box Statistics

本文提出了一种在统计效率与 oracle 效率之间进行权衡的差分隐私方案，用于估计任意黑盒函数的统计量，并证明了该方案近乎最优。

Günter F. Steinke, Thomas Steinke2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

本文提出了名为 SelfOrg 的框架，通过让大语言模型多智能体基于响应条件动态评估贡献并构建有向无环图来自组织通信结构，从而在无需额外监督或训练的情况下显著提升协作效率，特别是在弱模型场景下表现优异。

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

本文提出了一种名为 CroSTAta 的跨状态转换注意力 Transformer，通过引入新颖的状态转换注意力（STA）机制并结合训练时的时序掩码策略，使机器人策略能够显式建模演示中的时序结构（如失败与恢复模式），从而在模拟环境中显著提升了处理执行变化及精密任务的能力。

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG