cs.LG 篇论文 | Gist.Science

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

该论文提出了一种无需额外标签的通用框架来评估多重实例学习（MIL）热图的质量，并通过大规模基准测试发现扰动法、层相关传播（LRP）和积分梯度（IG）等方法优于传统的注意力热图，从而验证了改进的可解释性对于提升数字病理模型可靠性及获取生物学洞察的重要性。

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

该论文提出了一种结合 Koopman 算子（通过 EDMD 近似）与波变换特征及 Transformer 架构的心电图分类方法，研究发现虽然简单的特征混合未带来提升，但通过优化径向基函数字典构建的 Koopman 特征在四分类任务中表现优于波变换基线及混合系统，有效展示了将动力系统理论融入时间序列分类的潜力。

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

该论文提出用固定的参数化沃尔什 - 阿达玛变换替代多头注意力中的密集输出投影，在消除约 25% 注意力参数并显著降低内存与推理成本的同时，保持了模型在标准基准测试上的性能甚至略有提升。

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

本文提出了一种针对时间序列分类问题的新型反事实解释生成方法，通过在输入空间进行梯度优化并结合软动态时间规整（soft-DTW）与k近邻约束，有效生成了兼具有效性、稀疏性、邻近性以及符合真实时间分布结构的高可信度反事实样本。

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

该论文通过证明在线均值差估计量与带有最优控制变量的离线逆倾向评分估计量等价，以及回归调整方法与双重鲁棒估计的结构一致性，统一了在线实验与离线策略评估中常用的方差缩减方法。

Olivier Jeunen2026-03-10🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

该论文通过博弈论分析指出，现有基准测试因缺乏纳什均衡而导致开发者策略性“刷榜”的激励错位问题，并证明采用“先调优后测试”的新评估协议可在温和条件下构建出唯一纳什均衡，从而确保模型排名真实反映其潜在质量。

Yatong Chen, Guanhua Zhang, Moritz Hardt2026-03-10🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

该论文提出了一种基于分数阶微积分中加权分数阶魏尔积分的优化算法，通过引入动态加权的历史梯度记忆机制替代瞬时梯度，有效解决了极度不平衡数据（如金融欺诈检测）中的过拟合问题，并显著提升了模型性能。

Gustavo A. Dorrego2026-03-10🤖 cs.LG

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

该论文揭示了大语言模型具有类似变色龙的内在行为可塑性，并提出了一种名为 Token-Conditioned Reinforcement Learning (ToCoRL) 的框架，通过利用基于 Token 前缀的条件生成与强化学习，将推理时的行为适应转化为稳定的可学习模式，从而在不损害模型能力的情况下实现精确的行为控制（例如让擅长推理的模型也能高效回答事实性问题）。

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

该论文针对离线多智能体强化学习中非线性价值分解导致的训练不稳定问题，提出了一种保持贝尔曼不动点的尺度不变价值归一化（SVN）方法，并结合对关键组件交互的分析，总结出一套能够充分释放离线多智能体强化学习潜力的实用方案。

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Geometrically Constrained Outlier Synthesis

本文提出了几何约束异常值合成（GCOS）框架，通过在特征空间中生成符合流形结构的虚拟异常值并结合对比正则化，显著提升了深度神经网络在近分布异常检测任务中的鲁棒性，并支持向具有统计误差保证的共形异常检测扩展。

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Meta-RL with Shared Representations Enables Fast Adaptation in Energy Systems

该论文提出了一种结合双层优化与混合演员 - 评论家架构的元强化学习框架，通过共享状态特征提取器和参数共享机制显著提升了样本效率与任务适应性，并在近十年的真实建筑能源管理系统数据上验证了其优于传统方法的快速适应能力。

Théo Zangato, Aomar Osmani, Pegah Alizadeh2026-03-10🤖 cs.LG

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

该论文提出了 SYNAPSE 框架，这是一种无需重新训练的系统性方法，通过提取 CLS 表示、训练轻量级线性探针及前向钩子干预，实现了对 Transformer 模型内部神经元行为的跨领域分析与扰动测试，揭示了其内部表征的冗余稳定性与特定类别的脆弱性。

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

本文介绍了 IronEngine，这是一个围绕统一编排核心构建的通用 AI 助手平台，通过创新的三阶段流水线、分层记忆架构及自适应模型管理，实现了高效的任务规划与执行，并在文件操作基准测试中展现出卓越的性能。

Xi Mo2026-03-10🤖 cs.LG

Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning

该论文提出了一种名为 GRACE 的自适应动态扩展框架，通过“增长、评估、压缩”的循环策略，在类增量学习中有效平衡了模型的可塑性与稳定性，在实现顶尖性能的同时将内存占用降低了高达 73%。

Adrian Garcia-Castañeda, Jon Irureta, Jon Imaz, Aizea Lojo2026-03-10🤖 cs.LG

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

这项前瞻性临床可行性研究表明，在真实世界的初级保健环境中，由人工实时监督的 AMIE 对话式 AI 在安全性、患者满意度及诊断准确性方面表现良好，且其诊断与管理计划质量与初级保健医生相当，但在治疗方案的实用性和成本效益方面仍略逊一筹。

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

cs.LG