cs.AI 篇论文 | Gist.Science

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

本文提出了 XR-DT 框架，该框架结合扩展现实（XR）数字孪生技术与基于注意力机制的轨迹预测模型，通过新型的人类感知模型预测路径积分（HA-MPPI）控制器，实现了人机共享空间中安全、高效且可解释的机器人运动规划。

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

该论文指出强化学习导致大语言模型推理多样性下降的根源在于其隐式优化了“零强制”反向 KL 散度，并提出了一种基于 $\alpha$ -散度族的新方法，通过显式构建目标分布并调节精度与多样性的权衡，在 Lean 定理证明基准上实现了覆盖率和精度的最优平衡。

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

该论文提出了一种基于点云框架的事件驱动人体姿态估计方法，通过设计事件时间切片卷积与序列模块以及边缘增强表示，有效利用事件流的时空特性，在保持计算效率的同时显著提升了在稀疏事件条件下的姿态估计精度。

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

该论文提出了 A-3PO 方法，通过用简单插值替代显式计算来近似异步强化学习训练中的近端策略，从而在保持性能的同时消除了额外前向传播开销，使大语言模型训练速度提升了 1.8 倍。

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

本文提出了一种基于个体条件期望（ICE）曲线的全局敏感性分析方法，通过计算 ICE 曲线的期望特征重要性及其标准差来有效捕捉输入变量间的交互作用，克服了传统偏依赖图（PDP）在强交互场景下因平均化效应而掩盖交互信息的局限，并通过数学证明和多个工程算例验证了该方法在揭示数据驱动模型特征重要性方面的优越性。

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

该论文通过深入分析双曲几何中梯度优化失败的根本原因，提出了包含特征正则化、分类价值损失及优化友好型网络层的新算法 Hyper++，从而在 ProcGen 和 Atari-5 等基准测试中实现了比现有双曲及欧几里得方法更稳定、高效且性能更优的强化学习训练。

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

该论文首次系统研究了由大语言模型驱动的单智能体多工具架构中存在的“工具编排隐私风险”（TOP-R），通过构建基准测试揭示其普遍性并分析成因，进而提出了针对输出、推理和审查阶段的有效缓解策略。

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

CASA: Cross-Attention over Self-Attention for Efficient Vision-Language Fusion

该论文通过深入分析并改进交叉注意力机制，证明了其在视觉语言模型中不仅能实现与直接插入图像令牌相当的性能，还能显著降低长序列多图像对话及实时视频处理中的显存与计算开销。

Moritz Böhle, Amélie Royer, Juliette Marrie, Edouard Grave, Patrick Pérez2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

本文提出了 CARE（对比锚定反思）框架，通过结合锚定对比目标与反思引导重采样技术，将多模态推理中的失败案例转化为有效监督信号，从而在无需测试时反思的情况下显著提升模型准确率与训练稳定性。

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

该论文提出了首个针对动态图时序模式分析的LLM基准LLMTM，并设计了一种结合工具增强智能体与结构感知调度器的框架，在显著降低计算成本的同时实现了高精度的时序模式分析。

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

该论文提出了一种名为 WBC 的基于滑动窗口的成员推断攻击方法，通过聚合不同尺度局部上下文中的损失比较信号，显著提升了在微调大语言模型中识别训练数据的能力，并揭示了局部证据聚合比全局平均更有效的隐私漏洞。

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui Li2026-03-09🤖 cs.AI

Classroom AI: Large Language Models as Grade-Specific Teachers

该论文提出了一种通过集成七种可读性指标和聚类方法微调大语言模型的框架，成功生成了涵盖六个教育阶段的适龄教学内容，在保持事实准确性的同时将年级对齐度相比提示方法提升了 35.64 个百分点，从而有效应对全球师资短缺并促进教育公平。

Jio Oh, Steven Euijong Whang, James Evans, Jindong Wang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

该论文提出了一种无需显式噪声掩码的端到端音频 - 视觉语音识别框架，通过基于 Conformer 的瓶颈融合模块利用视觉线索隐式增强含噪音频特征，从而在保留语音语义完整性的同时提升了噪声环境下的识别鲁棒性。

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion

本文提出 PepEDiff，一种基于预训练蛋白嵌入模型和扩散机制的零-shot 生成框架，无需依赖中间结构预测即可直接生成具有高度多样性的新型肽结合剂，并在 TIGIT 等挑战性靶点上超越了现有最先进方法。

Po-Yu Liang, Tibo Duran, Jun Bai2026-03-09🤖 cs.AI

SpatialMem: Metric-Aligned Long-Horizon Video Memory for Language Grounding and QA

SpatialMem 提出了一种以记忆为核心的系统，利用度量 3D 空间作为可解释的索引支架，从单目 RGB 视频构建分层记忆以支持长程、语言引导的室内场景检索、问答及离线导航任务。

Xinyi Zheng, Yunze Liu, Chi-Hao Wu, Fan Zhang, Hao Zheng, Wenqi Zhou, Walterio W. Mayol-Cuevas, Junxiao Shen2026-03-09🤖 cs.AI

Neural Signals Generate Clinical Notes in the Wild

该论文提出了首个临床脑电到语言的基础模型 CELM，利用包含近万份报告的大规模数据集，实现了从长时程、变长脑电记录到多维度临床报告的端到端自动生成，并在标准生成指标上取得了显著性能提升。

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Localizing and Correcting Errors for LLM-based Planners

该论文提出了一种名为“局部化上下文学习”（L-ICL）的迭代指令增强方法，通过针对规划轨迹中的首个约束违反步骤注入最小修正示例，显著提升了大语言模型在符号经典规划任务中生成有效计划的准确率。

Aditya Kumar, William W. Cohen2026-03-09🤖 cs.AI

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

本文通过展示研究人员利用 Google Gemini 系列模型在理论计算机科学、经济学及物理学等领域成功解决开放问题、证伪猜想及生成新证明的案例，提炼出迭代优化、问题分解等高效人机协作技巧，并探讨了将模型作为对抗性审查者或嵌入神经符号循环等进阶应用，论证了 AI 作为科学发现创造性伙伴的潜力。

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Uncertainty Quantification in LLM Agents: Foundations, Emerging Challenges, and Opportunities

本文针对大语言模型智能体在复杂交互场景下不确定性量化研究的不足，提出了首个通用理论框架，系统剖析了四大关键技术挑战，并基于真实基准测试展望了该领域的未来发展方向。

Changdae Oh, Seongheon Park, To Eun Kim, Jiatong Li, Wendi Li, Samuel Yeh, Xuefeng Du, Hamed Hassani, Paul Bogdan, Dawn Song, Sharon Li2026-03-09🤖 cs.AI

From Features to Actions: Explainability in Traditional and Agentic AI Systems

该论文通过对比静态分类任务中的归因解释与智能体基准测试中的轨迹诊断，揭示了传统特征归因方法无法有效诊断智能体执行失败，从而论证了转向轨迹级可解释性对于评估和诊断自主 AI 行为（特别是状态跟踪不一致问题）的必要性。

Sindhuja Chaduvula, Jessee Ho, Kina Kim, Aravind Narayanan, Mahshid Alinoori, Muskan Garg, Dhanesh Ramachandram, Shaina Raza2026-03-09🤖 cs.AI