ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

该论文提出了 ActiveUltraFeedback,一种利用主动学习动态筛选高信息量样本以生成偏好数据的模块化流程,通过引入 DRTS 和 DeltaUCB 等新颖方法,仅用六分之一的标注数据即可实现与静态基线相当甚至更优的大语言模型对齐效果。

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas Krause2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

受生物空间认知机制启发,World2Mind 提出了一种无需训练的认知工具包,通过构建基于椭圆参数建模的 allocentric 空间树(AST)及三阶段推理链,使基础模型能够利用结构化空间知识显著提升三维空间推理能力,甚至让纯文本模型达到接近多模态模型的性能。

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

本文研究了基于模拟的推断(SBI)在中微子相互作用模型参数估计中的适用性,发现该方法在复现 MicroBooNE 合作组调优参数方面表现良好,且在使用原始实验数据时能获得比传统方法更优的拟合效果,同时还能有效近似 NuWro 等替代模拟。

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe Cerati2026-03-11⚛️ hep-ph