cs.AI 篇论文 | Gist.Science

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

该论文提出了一种名为 ELERAG 的检索增强生成架构，通过整合基于 Wikidata 的实体链接和混合重排序策略，显著提升了意大利语教育领域问答系统的事实准确性，并验证了领域自适应策略在解决通用模型与专业领域数据分布不匹配问题上的有效性。

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

本文提出了 EMFusion，这是一种基于条件扩散框架的频选电磁场概率预测模型，它通过集成多源上下文信息、采用残差 U-Net 与交叉注意力机制以及基于插补的采样策略，实现了对无线网络中多运营商、多频段电磁场水平的精准预测与可信的不确定性量化。

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

该论文通过仅使用单轮监督微调对 350M 参数的小语言模型进行优化，使其在工具调用任务上的表现（77.55% 通过率）显著超越 ChatGPT-CoT 等大型模型，证明了针对特定任务微调小模型是实现高效、低成本企业级生成式 AI 部署的有效途径。

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

该论文提出了名为 SAGE 的强化学习框架，通过引入序列展开机制和技能集成奖励，使大语言模型智能体能够利用技能库实现自我进化，在 AppWorld 基准测试中显著提升了任务完成率并降低了交互成本。

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

本文提出了 MCGI（流形一致性图索引）方法，通过利用局部内在维度（LID）动态调整搜索策略以解决高维空间中欧氏距离与测地线不匹配的问题，在十亿级磁盘驻留向量搜索中显著提升了吞吐量并降低了查询延迟。

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

该论文提出了 CRANE 框架，通过基于功能必要性的神经元级干预而非激活幅度启发式方法，更精准地识别出多语言大模型中语言特异但非排他的神经元组件。

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

该论文提出了一种名为贝叶斯生成建模（BGM）的统一框架，通过随机迭代贝叶斯更新算法学习生成模型，从而无需重新训练即可实现对任意变量子集的灵活条件推断，并兼具优越的预测性能、不确定性量化能力及理论保证。

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

该论文针对卫星巨型星座时代的需求，提出了对齐底层能力原则并开源了名为 SpaceHMchat 的人机协作全闭环航天器电源系统健康管理框架，通过构建硬件级故障注入实验平台及发布首个相关数据集，验证了其在工况识别、异常检测、故障定位及维护决策等任务中的卓越性能。

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

本文提出了 CLEAR-Mamba 框架，通过引入基于超网络的自适应条件层（HaC）和基于证据不确定性学习的不确定性感知预测方案（RaP），并结合构建的大规模多模态眼底血管造影数据集，显著提升了眼科血管造影图像分类的跨域适应性、准确性及预测可靠性。

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

该论文提出了一种利用大语言模型驱动的网络研究代理自动生成并解决大规模多样化现实世界预测问题的系统，该系统在生成可验证问题和准确解决方面的表现优于人类策划平台，并成功验证了更智能的模型及问题分解策略能显著提升预测精度。

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

该论文提出了一种名为 EigenData 的统一框架，通过结合自进化合成数据引擎与基于验证器的强化学习（RL），有效解决了多轮交互式工具使用智能体在数据合成扩展性及训练信号噪声方面的挑战，并在 tau^2-bench 基准测试中取得了媲美或超越前沿模型的性能。

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

Multi-head automated segmentation by incorporating detection head into the contextual layer neural network

该论文提出了一种将检测头集成到上下文层中的门控多头 Swin U-Net 架构，通过利用切片级结构检测输出对分割预测进行门控，有效抑制了放疗自动分割中因解剖结构缺失而产生的假阳性（幻觉），显著提升了模型在临床工作流中的鲁棒性与解剖合理性。

Edwin Kys, Febian Febian2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

本文提出了 UAT-LITE，一种无需重新训练即可在推理阶段通过蒙特卡洛 Dropout 将自注意力机制不确定性化的框架，通过引入层间方差分解诊断不确定性累积，显著提升了预训练 Transformer 在分布偏移下的校准性能与选择性预测能力。

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

该论文提出了 WebAccessVL，一种结合违规检测信息的视觉语言模型，通过监督式图像条件程序合成任务，在保持网页原始视觉设计的同时，自动修复 HTML 代码以显著降低 WCAG2 无障碍违规数量。

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

该论文指出，用户对聊天机器人的信任往往源于利用认知偏差的交互设计而非真正的可信度，因此建议将聊天机器人重新定义为组织目标导向的“高技能销售人员”，以区分心理信任形成与规范性可信度之间的关键差异。

Aditya Gulati, Nuria Oliver2026-03-11🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

该论文针对现有单目法线估计方法存在的 3D 几何错位问题，提出了一种名为 RoSE 的新范式，通过将法线估计重构为对几何信息更敏感的“阴影序列估计”，利用图像到视频生成模型预测阴影序列并求解最小二乘问题，从而在真实世界基准测试中实现了最先进的性能。

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song Bai2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

该论文提出了名为"Infusion"的框架，利用可扩展的影响函数近似技术，通过对训练数据施加微小扰动来诱导模型产生目标行为，实验表明该方法在视觉和语言领域均能有效且隐蔽地塑造模型行为，并具备跨架构的迁移能力。

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

该论文提出了一种面向神经形态视觉的持续学习框架，通过整合经验回放、可学习神经元参数及自适应脉冲调度机制，在满足能量约束的同时有效缓解了灾难性遗忘，并在帧基与事件基数据集上分别实现了精度提升与能耗降低的双重优化。

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

受非平衡热力学启发的扩散模型虽性能卓越但推理延迟高，而现有蒸馏技术因丢弃中间步骤导致结构信息丢失和离散化误差，为此本文提出了 B-DENSE 框架，通过多分支轨迹对齐机制，让学生模型在扩展通道中同时映射教师轨迹的所有离散中间步骤，从而在训练早期实现密集监督并显著提升生成质量。

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

该论文通过信息论证明，在复用单一本体状态空间的经典模型中，语境性必然导致不可消除的信息成本，而量子理论通过放弃所有测量统计源于单一经典本体变量的假设成功规避了这一限制。

Song-Ju Kim2026-03-11⚛️ quant-ph