cs.AI 篇论文 | Gist.Science

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

该研究提出利用基于大语言模型的全自动 AI 分析师在大规模、低成本地复现人类多分析师研究中的分析多样性，揭示了不同 AI 代理对同一数据集的分析结果存在显著差异且可被引导，从而论证了 AI 自动化实证科学中证据易受选择性报告影响的挑战，并呼吁建立包含“多元宇宙”式报告及提示词完全披露的新透明度规范。

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

No Need For Real Anomaly: MLLM Empowered Zero-Shot Video Anomaly Detection

本文提出了 LAVIDA 框架，通过利用多模态大语言模型增强语义理解、采用异常暴露采样器生成伪异常进行零样本训练，并结合基于反向注意力的 Token 压缩技术，在无需真实异常数据的情况下实现了视频异常检测的 SOTA 性能。

Zunkai Dai, Ke Li, Jiajia Liu, Jie Yang, Yuanyuan Qiao2026-03-12🤖 cs.AI

PatchDenoiser: Parameter-efficient multi-scale patch learning and fusion denoiser for Low-dose CT imaging

本文提出了 PatchDenoiser，一种轻量级、多尺度补丁学习与融合的去噪框架，旨在通过平衡性能与计算效率，在显著降低参数量和能耗的同时，有效去除低剂量 CT 图像噪声并保留精细解剖细节。

Jitindra Fartiyal, Pedro Freire, Sergei K. Turitsyn, Sergei G. Solovski2026-03-12🤖 cs.AI

Adversarial Hubness Detector: Detecting Hubness Poisoning in Retrieval-Augmented Generation Systems

本文介绍了 HubScan，一种针对检索增强生成（RAG）系统中“枢纽性投毒”攻击的安全扫描工具，它通过集成多种统计与稳定性检测机制，在多种向量数据库和基准测试中实现了对恶意枢纽的高召回率检测。

Idan Habler, Vineeth Sai Narajala, Stav Koren, Amy Chang, Tiffany Saade2026-03-12🤖 cs.AI

AMLRIS: Alignment-aware Masked Learning for Referring Image Segmentation

本文提出了无需修改架构且推理零开销的“对齐感知掩码学习”（AML）策略，通过量化区域对齐度并过滤低质量像素，有效解决了 referring image segmentation 训练中的误导梯度问题，从而在 RefCOCO 系列数据集上实现了最先进的性能并提升了模型鲁棒性。

Tongfei Chen, Shuo Yang, Yuguang Yang, Linlin Yang, Runtang Guo, Changbai Li, He Long, Chunyu Xie, Dawei Leng, Baochang Zhang2026-03-12🤖 cs.AI

A Minimal Agent for Automated Theorem Proving

该论文提出了一种具备迭代证明优化、库搜索和上下文管理等核心功能的极简智能体基线，其开源实现在性能上可与最先进系统媲美，且架构更简单、样本效率和成本效益更优。

Borja Requena, Austin Letson, Krystian Nowakowski, Izan Beltran Ferreiro, Leopoldo Sarra2026-03-12🤖 cs.AI

Defensive Refusal Bias: How Safety Alignment Fails Cyber Defenders

该论文揭示了大型语言模型在网络安全领域存在“防御性拒绝偏见”，即过度依赖语义相似性而非意图判断，导致模型频繁拒绝甚至因用户声明授权而更频繁地拒绝合法的防御性任务（如系统加固和恶意软件分析），从而阻碍了网络安全防御工作。

David Campbell, Neil Kale, Udari Madhushani Sehwag, Bert Herring, Nick Price, Dan Borges, Alex Levinson, Christina Q Knight2026-03-12🤖 cs.AI

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

该论文提出了 CARE 框架，通过解耦视觉定位与推理模块、引入专家级证据生成及强化学习优化，构建了一个模拟临床工作流的智能体系统，从而显著提升了多模态医疗推理的准确性与临床可问责性。

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

SEED-SET: Scalable Evolving Experimental Design for System-level Ethical Testing

本文提出了 SEED-SET 框架，这是一种基于贝叶斯实验设计的系统级伦理测试方法，它通过结合领域客观评估与利益相关者的主观价值判断，利用分层高斯过程建模和新型采集策略，有效解决了自主系统在高风险场景中伦理对齐评估的难题，并在测试候选生成效率与高维空间覆盖度上显著优于基线方法。

Anjali Parashar, Yingke Li, Eric Yang Yu, Fei Chen, James Neidhoefer, Devesh Upadhyay, Chuchu Fan2026-03-12📊 stat

BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation

本文提出了名为 BrandFusion 的多智能体框架，通过离线构建品牌知识库与在线多智能体协同迭代优化提示词，在文本生成视频任务中实现了品牌无缝植入，同时有效兼顾了语义保真度、品牌辨识度与融合自然性。

Zihao Zhu, Ruotong Wang, Siwei Lyu, Min Zhang, Baoyuan Wu2026-03-12🤖 cs.AI

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

该论文首次系统评估了代码分析领域的多任务参数高效微调（PEFT），发现共享 PEFT 模块不仅能以极低的计算和存储成本实现媲美单任务微调的精度，且显著优于通用大模型的直接提示，同时揭示了任务稳定性、互补性及数据质量等关键因素对多任务协同微调效果的决定性影响。

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Explainable LLM Unlearning Through Reasoning

该论文提出了一种名为“目标推理遗忘”（TRU）的新方法，通过引入基于推理的遗忘目标并结合监督损失与梯度上升损失，在实现大语言模型精准、可解释的知识移除的同时，有效保留了模型的通用能力并增强了其鲁棒性。

Junfeng Liao, Qizhou Wang, Shanshan Ye, Xin Yu, Ling Chen, Zhen Fang2026-03-12🤖 cs.LG

AraModernBERT: Transtokenized Initialization and Long-Context Encoder Modeling for Arabic

本文提出了针对阿拉伯语的 AraModernBERT 模型，通过采用跨语言词元化初始化及原生长上下文建模技术，显著提升了掩码语言建模性能，并在多种下游判别与序列标注任务中展现了强大的迁移能力。

Omar Elshehy, Omer Nacar, Abdelbasset Djamai, Muhammed Ragab, Khloud Al Jallad, Mona Abdelazim2026-03-12💬 cs.CL

MoE-SpAc: Efficient MoE Inference Based on Speculative Activation Utility in Heterogeneous Edge Scenarios

本文提出了 MoE-SpAc 框架，通过将推测解码重构为内存管理的“信息前瞻传感器”，结合专家需求估计、异构负载均衡及异步执行引擎，有效解决了边缘设备上的 MoE 模型推理内存瓶颈，显著提升了吞吐量与推理速度。

Shuhuai Li, Jianghao Lin, Dongdong Ge, Yinyu Ye2026-03-12🤖 cs.LG

The Dunning-Kruger Effect in Large Language Models: An Empirical Study of Confidence Calibration

该论文通过实证研究发现，大型语言模型（如 Kimi K2）在准确率较低时表现出严重的过度自信，呈现出与人类认知中“邓宁 - 克鲁格效应”相似的校准偏差模式。

Sudipta Ghosh, Mrityunjoy Panday2026-03-12💬 cs.CL

Quantifying Hallucinations in Language Language Models on Medical Textbooks

该研究通过两项实验量化了医学教科书问答中大型语言模型的幻觉现象，发现 LLaMA-70B-Instruct 在提供高可信度回答时仍存在约 19.7% 的幻觉率，且幻觉率越低通常对应更高的临床实用性评分。

Brandon C. Colelough, Davis Bartels, Dina Demner-Fushman2026-03-12💬 cs.CL

Evolving Demonstration Optimization for Chain-of-Thought Feature Transformation

该论文提出了一种通过闭环演化轨迹级经验来优化上下文提示的框架，利用强化学习筛选高效特征变换序列并结合多样性感知选择器与思维链引导大语言模型，从而在特征变换任务中显著提升了生成质量、多样性及下游预测性能。

Xinyuan Wang, Kunpeng Liu, Arun Vignesh Malarkkan, Yanjie Fu2026-03-12💬 cs.CL

Causally Grounded Mechanistic Interpretability for LLMs with Faithful Natural-Language Explanations

该论文提出了一种将机制可解释性与自然语言解释相结合的管道，通过激活修补识别 GPT-2 Small 中因果关键的注意力头并生成解释，实验表明基于电路的解释虽具备 100% 的充分性但仅 22% 的完备性，且 LLM 生成的解释质量显著优于模板基线，同时揭示了模型置信度与解释忠实度之间无相关性。

Ajay Pravin Mahale2026-03-12💬 cs.CL

The System Hallucination Scale (SHS): A Minimal yet Effective Human-Centered Instrument for Evaluating Hallucination-Related Behavior in Large Language Models

本文介绍了受系统可用性量表启发的“系统幻觉量表”（SHS），这是一种轻量级、以人为本的评估工具，旨在从用户视角快速、可解释地衡量大语言模型在真实交互中表现出的幻觉相关行为，并通过实证研究验证了其良好的信效度与实用性。

Heimo Müller, Dominik Steiger, Markus Plass, Andreas Holzinger2026-03-12💬 cs.CL

A Two-Stage Architecture for NDA Analysis: LLM-based Segmentation and Transformer-based Clause Classification

该论文提出了一种结合 LLaMA-3.1-8B-Instruct 进行条款分割与微调 Legal-Roberta-Large 进行条款分类的两阶段架构，有效实现了非结构化保密协议（NDA）的自动化分析，并在分割和分类任务中分别取得了 0.95 和 0.85 的优异性能指标。

Ana Begnini, Matheus Vicente, Leonardo Souza2026-03-12💬 cs.CL