Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

本文提出了一种名为接触覆盖引导探索(CCGE)的通用方法,通过利用基于哈希编码的接触计数器来奖励新颖的接触模式并引导探索,显著提升了灵巧操作任务(如物体分离、抓取和重定向)的训练效率、成功率及向真实机器人的迁移能力。

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

该论文基于对 16 位从业者的访谈,揭示了前沿人工智能系统(如快速迭代、基准漂移等特性)对人类提升研究(RCT)中因果推断假设构成的独特挑战,并系统梳理了应对这些方法论难题的实用方案,以明确此类证据在高 stakes 决策中的适用边界。

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

本文通过计算机科学家与艺术史学家的跨学科合作,利用潜在空间分解、定量评估及因果分析等方法,揭示了视觉语言模型在识别艺术风格时提取的概念中有 73% 被判定为语义连贯且 90% 与风格预测相关,表明其识别机制在很大程度上与艺术史学家的判断标准相一致。

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

本文提出了 V2M-Zero,一种无需成对数据即可实现视频与音乐时间对齐生成的零样本方法,其核心在于利用跨模态共享的时序变化结构(通过模态内事件曲线捕捉),仅需微调文本转音乐模型并在推理阶段替换为视频事件曲线,即可在音频质量、语义对齐及时间同步性上显著超越现有基线。

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding

本文提出了一种结合跨视图交互、注意力融合及多视图一致性损失的时序 - 频谱融合 Transformer 模型,并引入特定于受试者的适配器,旨在利用现有受试者数据快速迁移知识,从而在仅需少量新受试者训练数据的情况下显著提升 RSVP-BCI 系统的解码性能并缩短部署准备时间。

Xujin Li, Wei Wei, Shuang Qiu + 1 more2026-03-11🤖 cs.AI