cs.AI 篇论文 | Gist.Science

The Compute ICE-AGE: Invariant Compute Envelope under Addressable Graph Evolution

该论文展示了基于确定性语义状态基底的 C++ 生产级实现，通过局部状态演化机制在 Apple M2 芯片上实现了不随节点规模（100 万至 2500 万）而增长的恒定延迟与极低能耗，证明了“计算冰河时代”（ICE-AGE）在仅受内存容量限制而非推理重计算成本约束下的可扩展性。

Raymond Jay Martin II2026-03-09🤖 cs.AI

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

本文提出了 FLoRG 框架，通过聚合单个低秩矩阵的 Gram 矩阵并结合 Procrustes 对齐技术，有效解决了联邦微调中 LoRA 方法存在的聚合误差与分解漂移问题，在显著提升下游任务精度的同时大幅降低了通信开销。

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR $\rightarrow$ LLM Pipelines?

该论文提出了一种匹配骨干测试方法并结合机制分析，揭示当前语音大语言模型在多数场景下实为成本高昂的级联系统，且在噪声环境下其性能甚至可能低于传统的“语音识别转文本再输入大模型”的级联方案。

Jayadev Billa2026-03-09🤖 cs.AI

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

本文提出了混合在线与离线策略优化的记忆增强强化学习框架 EMPO $^2$ ，通过利用记忆机制有效解决了大语言模型智能体在探索新状态时的瓶颈，并在 ScienceWorld 和 WebShop 等基准测试中显著提升了性能及泛化能力。

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

该论文从信息论角度将多模态大模型的模态坍塌现象重新定义为“失配解码”问题，揭示了其性能瓶颈源于解码器的评分规则而非编码器架构，并证明了训练目标直接决定了模型可提取的信息范围。

Jayadev Billa2026-03-09🤖 cs.AI

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

本文提出了名为 CoME 的新型移动智能体架构，通过引入四个针对特定推理阶段的专家模块、分阶段渐进式训练策略以及基于信息增益的 Info-DPO 优化方法，有效解决了现有移动智能体在屏幕总结、子任务规划等混合能力推理中难以实现解耦增强与平衡协同的问题，并在 AITZ 和 AMEX 数据集上取得了优于密集模型及混合专家方法的表现。

Yuxuan Liu, Weikai Xu, Kun Huang, Changyu Chen, Jiankun Zhao, Pengzhi Gao, Wei Liu, Jian Luan, Shuo Shang, Bo Du, Ji-Rong Wen, Rui Yan2026-03-09🤖 cs.AI

Theory of Code Space: Do Code Agents Understand Software Architecture?

该论文提出了“代码空间理论”（ToCS）基准，通过让 AI 代理在部分可观测条件下探索程序化生成的代码库并维护结构化信念状态，揭示了不同大模型在主动探索能力、信念自我支撑机制以及信念稳定性方面存在显著差异，表明当前代理在构建和维护软件架构理解方面仍面临挑战。

Grigory Sapunov2026-03-09🤖 cs.AI

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

该论文提出了一种基于隐式神经表示和重参数化策略的张量环函数分解方法，通过引入可学习潜张量与固定基的混合结构来优化频谱特性并改善训练动态，从而在图像修复、去噪、超分辨率及点云恢复等多维数据恢复任务中实现了优于现有方法的性能。

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

How Well Does Agent Development Reflect Real-World Work?

该论文通过系统分析 43 个基准测试与 72,342 个任务，揭示了当前 AI 代理开发过度集中于编程领域，与美国劳动力市场中实际就业和经济价值分布存在显著错位，并据此提出了涵盖性、真实性和细粒度评估三项原则，以指导设计更能反映社会重要性和技术挑战的基准测试。

Zora Zhiruo Wang, Sanidhya Vijayvargiya, Aspen Chen, Hanmo Zhang, Venu Arvind Arangarajan, Jett Chen, Valerie Chen, Diyi Yang, Daniel Fried, Graham Neubig2026-03-09🤖 cs.AI

Multimodal Mixture-of-Experts with Retrieval Augmentation for Protein Active Site Identification

本文提出了名为 MERA 的检索增强多模态混合专家框架，通过结合分层多专家检索与基于 Dempster-Shafer 证据理论的可靠性感知融合策略，有效解决了蛋白质活性位点识别中训练数据稀疏及模态可靠性估计不足的挑战，并在多个数据集上实现了最先进的预测性能。

Jiayang Wu, Jiale Zhou, Rubo Wang, Xingyi Zhang, Xun Lin, Tianxu Lv, Leong Hou U, Yefeng Zheng2026-03-09🤖 cs.AI

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

该论文通过两项研究揭示了当前 AI 代理在协同创作中缺乏对并发用户动作的实时理解能力，进而提出了能解析协作意图并实时自适应的 CLEO 系统，并通过决策模型阐明了人类与代理在委托、指导及并发协作等模式间的动态切换机制。

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho Kim2026-03-09🤖 cs.AI

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

本文介绍了名为 Whisper-RIR-Mega 的配对清洁与混响语音基准数据集，该数据集通过将 LibriSpeech 语料与 RIR-Mega 真实房间脉冲响应结合，并针对混响时间和直达声混响比进行分层划分，用于评估不同规模 Whisper 模型在房间声学条件下的自动语音识别鲁棒性。

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

本文提出了名为 RigidSSL 的几何预训练框架，通过结合刚性感知流匹配目标与大规模结构扰动及分子动力学数据，有效解决了现有蛋白质生成模型在几何联合学习、全局刚性理解及动态构象建模方面的局限，显著提升了蛋白质设计的可设计性、新颖性及构象系综的物理真实性。

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

Can LLM Aid in Solving Constraints with Inductive Definitions?

该论文提出了一种将大语言模型与约束求解器相结合的神经符号方法，通过让大语言模型迭代生成辅助引理来辅助求解涉及归纳定义的约束问题，实验表明该方法能将相关证明任务的成功率提升约 25%。

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

该论文通过对客服聊天bot的回顾性日记研究及对八位AI专家的半结构化访谈，运用五轮主题分析法提炼出AI治理与人类权威、人机循环迭代优化、AI系统生命周期与运营约束、以及人机团队协作协调四大主题，旨在为后续的人机回环（HITL）框架设计与验证提供实证依据。

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

本文介绍了名为"Companion"的艺术装置，它通过结合绘图机器人与大语言模型，利用上下文学习和实时工具调用实现人机语音与绘画的双向互动，将机器人从被动执行者转变为能推动共同视觉叙事的创造性伙伴，并经专家评估证实了其作品具备独特的审美价值与专业展览潜力。

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

本文通过一项涉及 20 名资深研究者的探索性设计研究，揭示了系统文献综述中存在的认知负荷与工具碎片化等挑战，并据此提出了名为 ARC 的设计原型，该原型通过多数据库集成、透明迭代搜索及可验证的 AI 辅助筛选，有效帮助研究者从繁琐的行政工作中解放出来，转向更具战略性的知识探索与负责任的人工智能辅助决策。

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

该论文提出了“遍历即策略”（Traversal-as-Policy）框架，通过将沙盒执行日志蒸馏为可执行的门控行为树（GBT），将控制策略从隐式生成转变为显式遍历，从而在 OpenHands 基准测试中显著提升了智能体的任务成功率、安全性并降低了成本。

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

RoboLayout 通过引入可微分的可达性约束和局部细化优化机制，扩展了 LayoutVLM 框架，使其能够生成既符合语义逻辑又适应不同具身智能体物理交互能力的 3D 室内场景布局。

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

本文从自然语言处理（NLP）研究者的视角出发，综述了化学信息学中受 NLP 启发的主流分子表示方法及其在人工智能驱动的化学与材料科学中的应用，旨在为跨领域研究人员提供一份结构表示指南。

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

cs.AI