cs.AI 篇论文 | Gist.Science

Do Compact SSL Backbones Matter for Audio Deepfake Detection? A Controlled Study with RAPTOR

该研究通过 RAPTOR 框架的受控实验表明，在音频深度伪造检测中，多语言 HuBERT 预训练轨迹带来的跨域鲁棒性比模型规模更为关键，使得 1 亿参数模型能媲美大型商业系统，且其在扰动下的校准稳定性优于 WavLM 变体。

Ajinkya Kulkarni, Sandipana Dowerah, Atharva Kulkarni, Tanel Alumäe, Mathew Magimai Doss2026-03-09🤖 cs.AI

Reflective Flow Sampling Enhancement

该论文提出了名为“反思流采样”（RF-Sampling）的训练无关推理增强框架，通过形式化推导证明其能隐式执行文本 - 图像对齐得分的梯度上升，从而有效解决了现有增强策略在 FLUX 等流匹配模型上表现不佳的问题，并显著提升了生成质量、提示词对齐度及测试时扩展能力。

Zikai Zhou, Muyao Wang, Shitong Shao, Lichen Bai, Haoyi Xiong, Bo Han, Zeke Xie2026-03-09🤖 cs.AI

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

该论文提出了一种两阶段框架，通过先在标注的人造字母表上训练对比学习教师模型，再利用蒸馏技术引导学生在无监督条件下学习历史文字系统的变形不变嵌入，从而在无需确切演化关系真值的情况下实现脚本相似性学习与聚类。

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

本文提出了 CRIMSON，这是一种基于临床指南的大语言模型评估框架，通过引入患者背景信息、细粒度的错误分类及基于临床重要性的加权机制，在诊断正确性、上下文相关性和患者安全性方面实现了对胸部 X 光报告生成任务更精准且与放射科专家判断高度一致的评估。

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI

Whisper-CD: Accurate Long-Form Speech Recognition using Multi-Negative Contrastive Decoding

本文提出了 Whisper-CD，一种无需训练的多负对比解码框架，通过对比干净音频与三种声学扰动生成的负向 logits，有效解决了 Whisper 模型在长语音识别中的幻觉、重复和遗漏问题，显著降低了词错率并提升了推理速度。

Hoseong Ahn, Jeongyun Chae, Yoonji Park, Kyuhong Shim2026-03-09🤖 cs.AI

MAPO: Mixed Advantage Policy Optimization for Long-Horizon Multi-Turn Dialogue

本文提出了名为 MAPO 的无 Critic 强化学习算法，通过利用判别模型提供的密集过程反馈并结合混合优势估计器，有效解决了主观多轮对话中长程信用分配与训练不稳定的难题，在多个情感智能基准测试中显著提升了模型性能与泛化能力。

Naifan Zhang, Ruihan Sun, Jinwei Su, Hengjie Yang, Zhengyuan Pan, Zhaohan Chen, Xiaofan Zhang2026-03-09🤖 cs.AI

FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

FlashPrefill 是一种通过瞬时模式发现与动态阈值机制，在无需排序或累积开销的情况下高效识别多种稀疏注意力模式，从而在长序列（256K）上实现 27.78 倍加速、且在短序列（4K）上仍能保持 1.71 倍加速的超快速预填充框架。

Qihang Fan, Huaibo Huang, Zhiying Wu, Juqiu Wang, Bingning Wang, Ran He2026-03-09🤖 cs.AI

Cut to the Chase: Training-free Multimodal Summarization via Chain-of-Events

本文提出了一种名为 CoE 的训练-free 多模态摘要框架，通过层级事件图（HEG）引导的“事件链”进行结构化推理，有效解决了现有方法对特定领域监督的依赖、跨模态对齐弱以及时序建模扁平化等问题，并在多个数据集上显著超越了现有最先进基线。

Xiaoxing You, Qiang Huang, Lingyu Li, Xiaojun Chang, Jun Yu2026-03-09🤖 cs.AI

Conversational Demand Response: Bidirectional Aggregator-Prosumer Coordination through Agentic AI

该论文提出了“对话式需求响应”（CDR）机制，利用代理人工智能构建双向多智能体架构，使聚合商与产消者通过自然语言进行透明、可解释的灵活互动，从而在保持自动化扩展性的同时增强用户自主权并确保持续参与。

Reda El Makroum, Sebastian Zwickl-Bernhard, Lukas Kranzl, Hans Auer2026-03-09🤖 cs.AI

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

本文提出了 TaPD 框架，通过结合基于渐进式知识蒸馏的观测自适应预测器与基于场景演化条件的时间回溯模块，有效解决了自动驾驶中因遮挡或感知受限导致的变长历史观测轨迹预测难题，并在不同观测长度下显著提升了预测性能。

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

GazeMoE: Perception of Gaze Target with Mixture-of-Experts

该论文提出了 GazeMoE 框架，通过在大模型中引入混合专家（MoE）模块自适应地融合眼动、头部姿态及上下文等多模态线索，并结合类别平衡损失与数据增强策略，有效解决了机器人视线目标估计中的泛化与类别不平衡难题，在基准测试中取得了最先进性能。

Zhuangzhuang Dai, Zhongxi Lu, Vincent G. Zakka, Luis J. Manso, Jose M Alcaraz Calero, Chen Li2026-03-09🤖 cs.AI

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

本文提出了一种名为 DeCoST 的两阶段学习框架，通过解耦离散路径选择与连续服务时间分配，在求解带时间窗和可变利润的定向问题（OPTWVP）时，显著提升了求解质量与推理效率。

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models

本文提出了 HiPP-Prune 框架，通过引入基于视觉敏感性的分层偏好条件化结构化剪枝策略，利用多目标 GRPO 优化在压缩视觉语言模型时实现任务效用、幻觉鲁棒性与压缩率之间的可控权衡。

Lincen Bai, Hedi Tabia, Raul Santos-Rodriguez2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

该研究通过评估 34 个大语言模型在放射学问答任务中的表现，发现引入基于检索的代理推理机制能显著降低模型间的决策离散度并增强跨模型的正确性鲁棒性，表明评估此类系统时不能仅依赖准确率或一致性，还需结合稳定性与潜在临床影响进行综合分析。

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

cs.AI