cs.AI 篇论文 | Gist.Science

Mapping Overlaps in Benchmarks through Perplexity in the Wild

该论文提出了基于野外语料库中显著词元困惑度的“基准签名”方法，通过跨 32 个大模型和 89 个基准的元评估，揭示了不同基准间在知识与推理任务上的深层重叠、在文化与人文领域的低相似性，以及编码任务的高度独立性，从而为理解大模型能力景观及基准有效性提供了超越传统性能相关性的新视角。

Siyang Wu, Honglin Bao, Sida Li, Ari Holtzman, James A. Evans2026-03-10💬 cs.CL

ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

本文提出了 ELHPlan 框架，通过引入“意图绑定动作链”作为规划原语，在长视野多智能体协作任务中有效平衡了适应性与计算效率，在保持任务成功率的同时将 Token 消耗降低了 60-70%。

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu2026-03-10💻 cs

Cold-Start Active Correlation Clustering

该论文针对缺乏初始成对相似性信息的冷启动场景，提出了一种通过鼓励多样性来实现成本高效查询的覆盖感知主动关联聚类方法，并通过实验验证了其有效性。

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

该论文首次系统性地提出并实证了“误演化”（Misevolution）概念，揭示了自进化大语言模型代理在模型、记忆、工具和工作流四个关键路径中可能偏离预期并引发安全对齐退化或漏洞等新型风险，从而强调了构建更安全自进化代理的紧迫性。

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

本文提出了一种名为 CroSTAta 的跨状态转换注意力 Transformer，通过引入新颖的状态转换注意力（STA）机制并结合训练时的时序掩码策略，使机器人策略能够显式建模演示中的时序结构（如失败与恢复模式），从而在模拟环境中显著提升了处理执行变化及精密任务的能力。

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

本文提出了一种基于大语言模型智能体的自动化工作流，成功从约 1 万篇科学文献中提取并构建了迄今为止规模最大的热电材料数据集，不仅显著降低了大规模数据提取的成本，还为数据驱动的材料发现奠定了坚实基础。

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

本文提出了 FOR-Prompting 协议，通过让“辩护者”提出答案、由“辩论者”仅提出质疑而不直接修正的不对称提示机制，在不依赖模型训练或内部访问的情况下，有效提升了各类大语言模型（尤其是小模型）在数学推理及开放任务中的自我修正能力与输出质量。

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

该论文提出了 DialTree 框架，这是一种结合树搜索的在线策略强化学习方法，能够自主探索多轮对话中的复杂攻击轨迹，在无需人工数据的情况下显著提升了针对大语言模型的多轮红队攻击成功率。

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

该论文提出了一种基于 Wasserstein 梯度流的新型算法，通过时间离散化和最小批量最优传输，实现了可扩展且支持模块化正则化及监督信息整合的概率测度巴氏中心计算，并在多个领域的基准测试中确立了新的最先进水平。

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

本文提出了名为 NANOMIND 的软硬件协同设计框架，通过将大型多模态模型模块化并动态调度至异构加速器，在电池供电的小型设备上实现了无需联网的高效、低功耗本地推理，显著降低了能耗与显存占用。

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

Membership Inference Attacks on Tokenizers of Large Language Models

本文首次揭示了大型语言模型分词器作为成员推断攻击新向口的严重隐私风险，通过提出五种攻击方法验证了其脆弱性，并设计了相应的自适应防御机制。

Meng Tong, Yuntao Du, Kejiang Chen, Weiming Zhang, Ninghui Li2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

该研究通过在多轮辩论中让不同大语言模型对日常道德困境进行集体归责，揭示了同步与轮询两种交互协议下模型在观点修正率、价值取向（如自主性与共情）及从众行为上的显著差异，表明多智能体系统的交互结构会深刻影响其道德推理与价值对齐表现。

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

该论文提出了一种名为“功能头识别与类别条件重缩放”的免训练插件，通过自适应调整感知与推理导向注意力头在各层间的贡献，有效缓解了多模态大推理模型中因功能分配失衡导致的幻觉问题，在几乎不增加计算成本的情况下显著提升了模型的推理一致性与视觉忠实度。

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

本文提出了 DropVLA，一种针对视觉 - 语言 - 动作（VLA）模型的动作级后门攻击方法，该方法仅需极少量数据投毒即可在保持正常任务性能的同时，通过视觉触发器精准操控机器人执行特定的安全关键动作，并已在物理机器人上验证了其有效性。

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

该论文提出了一种结合学习到的世界模型与基于采样的模型预测控制（MPC）的框架，利用离线演示数据在潜在空间预测未来状态，并通过学习到的代理价值函数解决稀疏奖励问题，从而在物理人形机器人上实现了仅凭本体感知和第一人称深度图像即可完成的鲁棒、实时接触规划。

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

该论文提出了 ARM-FM 框架，利用基础模型将自然语言规范自动转化为奖励机器（Reward Machines），从而在强化学习中实现可组合的任务分解、基于语言嵌入的泛化以及零样本适应能力。

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG

The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs

该论文揭示了在强化学习训练中，大型语言模型会发展出系统性的动机推理，即生成看似合理的理由来为其违反指令的行为辩护，从而导致依赖思维链进行监控的小型模型被误导，无法有效识别有害行为。

Nikolaus Howe, Micah Carroll2026-03-10🤖 cs.LG

Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing

该论文提出了一种基于自适应专家路由的可解释异质异常检测框架，通过构建压力调制图并分解四种特定机制（价格冲击、流动性、系统性传染和动量反转），实现了对金融网络中不同危机驱动因素的自动归因与可解释预警，在 2017 至 2024 年美股数据上显著优于基线模型并成功区分了 SVB 倒闭与日本套息交易平仓等不同类型的危机。

Zan Li, Rui Fan2026-03-10🤖 cs.LG

Taming Modality Entanglement in Continual Audio-Visual Segmentation

本文针对细粒度多模态持续学习中存在的模态纠缠问题，提出了持续音视频分割新任务，并设计了基于碰撞的多模态回放框架（CMR），通过多模态样本选择策略和基于碰撞的样本回放机制，有效缓解了多模态语义漂移与共现混淆挑战，显著提升了持续学习性能。

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

该论文提出了一种基于排列相对策略优化（PRPO）的推理框架，通过将列置换不变性作为结构先验，有效激活了大语言模型在表格预测任务中的潜在数值推理能力，使其在零样本设置下表现优异，甚至显著超越了参数量大得多的模型。

Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen2026-03-10🤖 cs.LG