Decomposing Physician Disagreement in HealthBench

该研究通过分解 HealthBench 数据集中的医师分歧发现,尽管大部分分歧源于病例本身的结构性特征且难以通过常规元数据消除,但区分“可消除的不确定性”(如信息缺失)与“不可消除的不确定性”(如固有医学模糊性)为优化评估设计提供了关键方向,即通过填补信息缺口可在不增加固有模糊性的情况下降低分歧。

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval

本文提出了无需训练的 WISER 框架,通过“检索 - 验证 - 优化”流程统一文本到图像和图像到图像两种检索范式,利用更广泛的搜索、自适应融合及基于自我反思的深度思考机制,显著提升了零样本组合图像检索的性能。

Tianyue Wang, Leigang Qu, Tianyu Yang, Xiangzhao Hao, Yifan Xu, Haiyun Guo, Jinqiao Wang2026-03-10💻 cs

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell 是一个端到端智能体框架,通过大语言模型驱动的语义统一器和自适应蒙特卡洛树搜索引擎,分别解决单细胞扰动研究中的语义异构与分布偏移挑战,实现了无需人工干预的自动化虚拟细胞建模。

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

本文提出了一种由大语言模型驱动的闭环框架,通过将自然语言指令映射为可执行规则并自动语义标注选项,有效解决了深度强化学习在数据效率、可解释性及跨环境迁移方面的关键挑战,并在 Office World 和 Montezuma's Revenge 任务中验证了其在约束合规与任务迁移上的优越性能。

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting

本文评估了 DINOv3 作为冻结骨干网络在蓝莓机器人采摘任务(如分割与检测)中的表现,指出其虽能通过轻量级解码器显著提升分割效果,但在处理尺度变化及空间聚合目标(如簇检测)时存在局限,因此更适合作为依赖下游空间建模的语义骨干而非端到端任务模型。

Rui-Feng Wang, Daniel Petti, Yue Chen, Changying Li2026-03-10💻 cs

Event-Driven Safe and Resilient Control of Automated and Human-Driven Vehicles under EU-FDI Attacks

本文提出了一种结合事件触发控制障碍函数、控制李雅普诺夫函数及自适应攻击恢复机制的事件驱动安全弹性控制框架,旨在确保网联自动驾驶车辆在混合交通流中面对指数无界虚假数据注入攻击及人类驾驶车辆不确定性时,仍能实现安全的车道变换与稳定运行。

Yi Zhang, Yichao Wang, Wei Xiao, Mohamadamin Rajabinezhad, Shan Zuo2026-03-10💻 cs

Generalized Per-Agent Advantage Estimation for Multi-Agent Policy Optimization

本文提出了一种名为广义单智能体优势估计器(GPAE)的多智能体强化学习新框架,该框架通过引入单智能体价值迭代算子和双截断重要性采样比率方案,在无需直接估计 Q 函数的情况下实现了稳定的离线策略学习与精准的信用分配,从而显著提升了复杂场景下的协调能力和样本效率。

Seongmin Kim, Giseung Park, Woojun Kim, Jiwon Jeon, Seungyul Han, Youngchul Sung2026-03-10💻 cs