cs.AI 篇论文 | Gist.Science

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

本文介绍了名为 Agora 的 AI 驱动平台，它利用大语言模型整合真实人类观点以模拟审议过程，初步研究表明该平台能有效帮助用户提升解决分歧、内部审议及达成共识的能力，为规模化公民教育提供了新方向。

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

Learning Concept Bottleneck Models from Mechanistic Explanations

本文提出了名为 Mechanistic CBM (M-CBM) 的新型概念瓶颈模型框架，该框架通过稀疏自编码器从黑盒模型中提取并命名内在概念，从而在严格控制信息泄露的前提下，显著提升了概念预测的准确性、决策稀疏性及解释的简洁性，并超越了现有的概念瓶颈模型。

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

该论文提出了 AgrI 挑战赛，通过引入多团队独立采集数据的跨团队验证（CTV）评估范式，揭示了单一数据源训练在农业视觉任务中的泛化缺陷，并证明了多源协作训练能显著缩小跨域泛化差距，同时发布了一个包含 5 万余张图像的大规模公开数据集以推动数据为中心的农业视觉研究。

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

该论文提出了一种利用嵌套 Dropout 为扩散模型、归一化流和变分自编码器引入可调复杂度先验的方法，通过在压缩感知等逆问题中动态平衡表示误差与过拟合风险，显著降低了重建误差并提供了相应的理论分析。

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

The Yerkes-Dodson Curve for AI Agents: Emergent Cooperation Under Environmental Pressure in Multi-Agent LLM Simulations

该研究通过网格生存环境中的 22 次实验，首次证实大语言模型多智能体系统的合作行为与心理压力之间呈现类似耶克斯 - 多德森定律的倒 U 型关系，表明适度的环境压力能最大化涌现合作，而极端压力会导致行为崩溃，且性选择机制能有效消除攻击性并促进沟通。

Ivan Pasichnyk2026-03-10💻 cs

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

该论文填补了亚 2000 万参数“小模型”领域的研究空白，揭示了在 TinyML 规模下模型误差率虽遵循幂律但指数更陡、饱和更早，且误差分布、类别难度偏好及校准度均随规模发生显著质变，从而证明直接套用大模型规律会误导边缘 AI 部署，必须在目标模型规模下进行验证。

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

这篇立场论文主张通过结合范畴论中的函子变换以消除语义偏差，以及利用检索增强生成（RAG）注入多样化外部知识，构建一个双管齐下的框架来确保大语言模型的公平性。

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

ConfHit: Conformal Generative Design with Oracle Free Guarantees

ConfHit 是一种无需实验验证器（Oracle）的分布无关框架，它利用加权交换性和多重样本密度比加权共形 p 值，为药物发现中的生成式设计提供统计保证，既能认证生成批次中是否包含有效候选分子，又能将其精炼为紧凑集合。

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

本文针对低资源场景下的英译印地语机器翻译，通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架（ALOPE 及其扩展 LoRMA），显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性，并公开了相关代码与数据集。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

针对并行光电路交换在 AI 训练流量调度中面临的非零重配置延迟挑战，本文提出了名为 Spectra 的算法，通过分解、负载均衡分配及受控置换分割三步策略，在多种 AI 工作负载和基准测试中显著缩短了调度时间并逼近理论下界。

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

这篇论文首次提出了一个统一框架，将代理式检索增强生成（Agentic RAG）系统形式化为序贯决策过程，并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

该论文提出了一种基于特征区分性、稀疏性（奥卡姆剃刀）及分布重叠性的原则性框架，通过形式化定理证明了稀疏假设在训练与测试分布仅部分重叠时仍能实现泛化，并将该理论推广至子空间联合分类器。

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

该论文提出了名为 AQuA 的细粒度数据集，通过将模糊视觉问答按模糊程度分类并定义最优响应策略，训练视觉语言模型使其能够识别模糊性并自适应地选择直接回答、推断意图、列举替代方案或请求澄清等策略，从而在模糊场景下显著优于现有基线模型。

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

本文提出了 LoRA-SP（Select-Prune）方法，通过引入基于能量目标的秩自适应机制，使视觉语言动作模型（VLA）能够根据输入和层级动态调整微调容量，从而在显著减少可训练参数的同时，有效解决多任务场景下的跨任务干扰问题并提升泛化性能。

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

该论文针对现有通用图像恢复模型在扩展多退化任务时面临的训练不稳定、模型臃肿及性能下降等局限，提出了一种基于多分支混合专家架构的统一推理流程，通过解耦退化知识实现了可扩展、可控制且具备强泛化能力的通用图像恢复。

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

本文综述了机器学习在解决水声通信延迟、能耗及动态拓扑等挑战中的关键作用，通过涵盖从物理层到应用层的分层分析，展示了其在提升定位、路由、数据压缩及整体网络性能方面的显著成效，并指出了当前部署面临的局限与未来发展方向。

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

该论文提出了“上下文信道容量”这一信息论框架，证明了零遗忘要求上下文信号与生成参数间存在足够的互信息，揭示了传统状态型持续学习方法的“不可能三角”局限，并指出通过架构设计（如超网络）重构参数为函数值而非状态是实现零遗忘的关键。

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

本文针对公共交通微循环中“即时确认预约请求”与“持续优化已确认路线”难以兼顾的痛点，提出了一种结合快速插入搜索、随时优化算法及强化学习非短视目标函数的新型动态车辆路由框架，并在真实数据集上验证了其在提升服务请求数量方面的显著优势。

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架，通过结合可执行代码与生成式大模型，在高效合成测试环境的同时显著降低了幻觉问题，并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

本文提出了名为 OrthoFormer 的因果驱动架构，通过将工具变量估计嵌入 Transformer 隐藏状态并利用神经控制函数，有效解决了传统模型因混淆静态背景与动态因果流而导致的分布外泛化失败问题，实现了从相关性学习到因果推断的范式转变。

Charles Luo2026-03-10🤖 cs.LG