BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models

该论文提出了一个评估工具选择偏差的基准,揭示了大型语言模型在从功能等效工具中选择时存在显著偏差(主要受语义匹配、描述扰动及预训练曝光影响),并设计了一种先过滤后均匀采样的轻量级策略以有效缓解该问题。

Thierry Blankenstein, Jialin Yu, Zixuan Li, Vassilis Plachouras, Sunando Sengupta, Philip Torr, Yarin Gal, Alasdair Paren, Adel Bibi2026-03-12🤖 cs.AI

MonitorVLM:A Vision Language Framework for Safety Violation Detection in Mining Operations

本文提出了名为 MonitorVLM 的视觉 - 语言框架,通过构建包含 9000 个样本的矿业违规数据集,并创新性地引入条款筛选和行为放大模块,显著提升了矿山作业中安全违规行为检测的精度与效率,实现了从监控视频流到自动违规报告的智能化闭环。

Jiang Wu, Sichao Wu, Yinsong Ma, Guangyuan Yu, Haoyuan Xu, Lifang Zheng, Jingliang Duan2026-03-12🤖 cs.AI

What We Don't C: Manifold Disentanglement for Structured Discovery

该论文提出了一种名为"What We Don't C"的新方法,利用潜在流匹配技术通过显式移除条件引导中的信息来解耦潜在子空间,从而生成有意义的残差表示,使未被条件变量捕获的变异因子更易被利用,进而实现对生成模型潜在表示的分析、控制与再利用。

Brian Rogers, Micah Bowles, Chris J. Lintott, Steve Croft, Oliver N. F. King, James Kostas Ray2026-03-12🤖 cs.AI

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

本文提出了一种针对医疗数据隐私风险的层次化双策略遗忘框架,通过几何约束梯度更新与概念感知令牌级干预相结合,在仅修改 0.1% 参数的情况下实现了 82.7% 的遗忘率与 88.5% 的知识保留,有效平衡了敏感信息移除与基础医疗能力保持的需求。

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

本文提出了 CostNav,这是首个结合行业标准监管与财务数据及物理仿真的经济导航基准,通过量化分析揭示现有导航方法在真实商业部署中均无法实现经济可行性,从而挑战社区开发以经济成本为核心指标的导航策略。

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

本文提出了名为 Trio 的分子生成框架,通过整合片段式分子语言模型、强化学习与蒙特卡洛树搜索,实现了兼具可解释性、合成可行性与高结合亲和力的闭环靶向分子设计,显著优于现有最先进方法并大幅拓展了化学空间多样性。

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI