cs.AI 篇论文 | Gist.Science

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

本文提出了 CeRA（容量增强型秩适应）方法，通过引入 SiLU 门控和结构式丢弃在权重层面实现流形扩展，从而突破低秩适应（LoRA）在复杂推理任务中因线性约束导致的性能瓶颈，以显著更低的秩实现了超越高秩 LoRA 的谱效率与推理能力。

Hung-Hsuan Chen2026-03-10🤖 cs.LG

On Sample-Efficient Generalized Planning via Learned Transition Models

本文提出了一种基于学习显式转移模型的广义规划方法，通过让神经网络自回归预测中间世界状态而非直接预测动作序列，在多个领域中以更少的训练样本和更小的模型实现了比直接动作预测更强的分布外泛化能力。

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

该论文通过利用经过优化的微调大语言模型生成数百万条文本相关性标签，有效解决了专家标注稀缺的难题，并在 App Store 搜索排序中实现了行为相关性与文本相关性的同步提升，最终在全球 A/B 测试中显著提高了转化率，尤其在长尾查询场景下效果最为突出。

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

本文提出了 Attn-QAT，一种针对 4 比特注意力机制的量化感知训练方法，通过解决反向传播中的精度失配问题，在无需显式异常值抑制的情况下实现了稳定的 FP4 训练与推理，并在 RTX 5090 上带来了高达 1.5 倍的加速。

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

PEPA: a Persistently Autonomous Embodied Agent with Personalities

本文提出了 PEPA，一种通过三层认知架构利用人格特质作为内在组织原则，使具身智能体能够在无需外部任务指令的情况下自主生成目标并实现持久自主运行的机器人系统。

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

How Well Do Multimodal Models Reason on ECG Signals?

本文提出了一种可复现的评估框架，通过将心电图推理分解为“感知”（利用代理框架生成代码验证时序结构）和“推理”（基于检索比对临床准则）两个独立组件，实现了对多模态模型在心电图信号上真实推理能力的可扩展验证。

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

该论文提出了一种共形预测框架，通过针对不同临床文档结构（如结构化 FDA 标签与自由文本放射报告）中大语言模型置信度校准偏差的异质性进行自适应调整，在确保医疗实体提取达到 90% 以上覆盖率的同时实现了可控的拒绝率，从而为临床安全部署提供了保障。

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

该技术报告通过引入城市资源分配新案例，跨领域验证了可解释性解决方案空间（ESS）框架的通用性，证明其能根据治理角色、风险特征及利益相关者配置系统性地调整可解释 AI 策略，从而成为适用于各类社会技术系统的通用决策支持工具。

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

该论文针对 2026 年 F1 新规下因对手隐藏状态导致的部分可观测随机博弈问题，提出了一种结合隐藏马尔可夫模型（HMM）推断对手能量状态与深度 Q 网络（DQN）制定决策的两层框架，有效解决了传统单智能体优化方法无法应对的“反收割陷阱”等复杂策略挑战。

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell 是一个端到端智能体框架，通过大语言模型驱动的语义统一器和自适应蒙特卡洛树搜索引擎，分别解决单细胞扰动研究中的语义异构与分布偏移挑战，实现了无需人工干预的自动化虚拟细胞建模。

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

本文提出了一种由大语言模型驱动的闭环框架，通过将自然语言指令映射为可执行规则并自动语义标注选项，有效解决了深度强化学习在数据效率、可解释性及跨环境迁移方面的关键挑战，并在 Office World 和 Montezuma's Revenge 任务中验证了其在约束合规与任务迁移上的优越性能。

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

该论文提出了一种检测门控流水线，通过结合定位器与分割器及时间一致性机制，实现了跨数据集鲁棒的高清喉镜声门区域波形提取，并验证了其在区分健康与病理发声功能中的临床有效性。

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

本文提出了一种结合 CoAtNet 架构与模型汤（Model Soups）技术的框架，通过集成多样化检查点来降低方差并提升泛化能力，从而在数据稀缺的湄公河三角洲非物质文化遗产图像分类任务中取得了优于现有基准的优异性能。

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory

该论文提出了一种诊断框架，通过对比不同写入与检索策略在 LoCoMo 数据集上的表现，发现检索方法对 LLM 代理性能的影响远大于写入策略，且当前更高效的原始分块存储配合优质检索往往优于昂贵的摘要式写入方案。

Boqin Yuan, Yue Su, Kun Yao2026-03-10🤖 cs.AI

Agentified Assessment of Logical Reasoning Agents

本文提出了一种基于代理的评估框架，通过引入评估代理来确保逻辑推理任务评估的可复现性与鲁棒性，并在 FOLIO 数据集上验证了该方法下自动形式化代理在逻辑推理任务中显著优于思维链基线的表现。

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

本文提出了一种无需梯度计算或参数更新的无监督方法，通过引入 GramCol 和运动特征选择算法生成可解释的运动注意力图（IMAP），从而在视频扩散 Transformer 中实现了对运动及非运动概念时空定位的精准解释。

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

该论文通过引入停止时间/鞅分析，在经典有界方差假设下首次从理论上证明了 Adam 算法的高概率收敛性对置信参数 $\delta$ 的依赖为 $\delta^{-1/2}$ ，优于 SGD 算法必然存在的 $\delta^{-1}$ 依赖，从而解释了 Adam 具有更尖锐尾部（即更优的高概率收敛表现）的原因。

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

该论文提出了组分探针分解（CPD）方法，揭示了在原子基础模型中，任务对齐度是决定几何与组分信息能否线性解耦的主导因素，并发现不同架构模型间存在显著的线性可及性梯度，且信息在特定对称性通道（如向量通道编码偶极矩、标量通道编码能隙）中按对称类型路由。

Joshua Steier2026-03-10🤖 cs.LG

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

该论文通过受控实验表明，基于输出分布的污染检测方法（CDD）在小型语言模型中因依赖verbatim记忆而表现不佳，其效果远不如困惑度（perplexity）和 Min-k% Prob 等概率基方法。

Omer Sela (Tel Aviv University)2026-03-10💬 cs.CL

Agentic SPARQL: Evaluating SPARQL-MCP-powered Intelligent Agents on the Federated KGQA Benchmark

本文探讨了基于模型上下文协议（MCP）的 SPARQL 智能体在联邦知识图谱问答中的潜力，通过扩展现有基准测试并评估不同架构在端点发现、模式探索及查询构建等任务中的表现，实现了自动化 SPARQL 联邦查询与智能体 AI 的有机结合。

Daniel Dobriy, Frederik Bauer, Amr Azzam + 2 more2026-03-10🤖 cs.AI