Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

该研究通过评估 34 个大语言模型在放射学问答任务中的表现,发现引入基于检索的代理推理机制能显著降低模型间的决策离散度并增强跨模型的正确性鲁棒性,表明评估此类系统时不能仅依赖准确率或一致性,还需结合稳定性与潜在临床影响进行综合分析。

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Artificial Intelligence for Climate Adaptation: Reinforcement Learning for Climate Change-Resilient Transport

该论文提出了一种基于强化学习的决策支持框架,用于在气候不确定性下制定长期的城市交通防洪适应策略,并通过哥本哈根案例研究表明,该方法在发现协调的空间与时间适应路径及平衡投资与风险方面优于传统优化方法。

Miguel Costa, Arthur Vandervoort, Carolin Schmidt, João Miranda, Morten W. Petersen, Martin Drews, Karyn Morrisey, Francisco C. Pereira2026-03-09🤖 cs.AI

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

本文提出了名为 EpisTwin 的神经符号架构,通过构建以用户为中心的个人知识图谱,结合多模态大模型与代理协调机制,有效解决了个人 AI 因数据孤岛和向量检索局限而导致的语义理解与推理难题,并借助合成基准 PersonalQA-71-100 验证了其在可信赖个人智能领域的优越性能。

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models

本文提出了 DEX-AR,一种专为自回归视觉语言模型设计的动态可解释性方法,它通过计算生成过程中的层间注意力梯度,结合动态头过滤与序列级过滤机制,生成能够区分视觉与语言信息的 token 级及序列级 2D 热力图,从而有效提升了模型决策过程的透明度与可解释性。

Walid Bousselham, Angie Boggust, Hendrik Strobelt, Hilde Kuehne2026-03-09🤖 cs.AI

Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions

这项研究通过对比实验发现,虽然基于大语言模型(LLM)的消息生成方式在用户感知帮助度上显著优于模板化方法,但结合上下文多臂老虎机(Bandit)的优化策略并未带来额外收益,表明在个性化健康行为干预中,对用户输入的语境化回应比单纯的结构化探索或生成灵活性更为关键。

Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

该论文介绍了一种名为 AIRT 的端到端深度学习框架,它能在单块 Nvidia A100 GPU 上不到一秒的时间内,直接从 CT 图像和结构轮廓生成前列腺 VMAT 放疗计划,并在靶区覆盖度和器官保护等关键指标上展现出与 RapidPlan Eclipse 相当的非劣效性。

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

K-MaT: Knowledge-Anchored Manifold Transport for Cross-Modal Prompt Learning in Medical Imaging

本文提出了 K-MaT(知识锚定流形传输)框架,通过结合临床文本锚定提示并采用融合 Gromov-Wasserstein 最优传输技术对齐流形,实现了无需低质量模态训练数据即可将大型生物医学视觉 - 语言模型从高端成像(如 CT)有效迁移至低质量模态(如 X 光),从而在多个跨模态基准测试中取得了优于现有方法的性能并缓解了灾难性遗忘问题。

Jiajun Zeng, Shadi Albarqouni2026-03-09🤖 cs.AI

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

本文提出了名为 CLAIRE 的混合深度学习框架,通过结合无监督深度表征学习与监督分类,并利用博弈论可解释性技术分析潜在空间,有效解决了高维工业环境中传感器数据噪声大、冗余多的问题,显著提升了智能制造系统中的故障检测精度与可解释性。

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

ESAA-Security: An Event-Sourced, Verifiable Architecture for Agent-Assisted Security Audits of AI-Generated Code

本文提出了 ESAA-Security 架构,这是一种专为 AI 生成代码安全审计设计的、基于事件溯源的验证性框架,它通过将代理认知与确定性状态变更分离,并采用追加日志、约束输出及重放验证机制,将安全审查从自由形式的对话转化为可追溯、可复现且基于证据的治理流程。

Elzo Brito dos Santos Filho2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

该论文针对科学工作流中确定性与灵活性难以兼得的矛盾,提出了一种通过机器可验证的“模式门控”将对话自由与执行严格相分离的架构,并验证了多模型评分在系统评估中的有效性,旨在实现既灵活又可复现的代理式 AI 科学工作流。

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI