No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

该论文通过引入可控偏差的评估框架,实证分析了标签偏差和选择偏差对分类模型评估、性能及去偏方法有效性的差异化影响,揭示了在无偏测试集下公平性与准确性之间不存在权衡,并强调了针对特定偏差类型优化评估与缓解策略的重要性。

Magali Legast, Toon Calders, François Fouss2026-03-11🤖 cs.LG

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

该论文提出了 ActiveUltraFeedback,一种利用主动学习动态筛选高信息量样本以生成偏好数据的模块化流程,通过引入 DRTS 和 DeltaUCB 等新颖方法,仅用六分之一的标注数据即可实现与静态基线相当甚至更优的大语言模型对齐效果。

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas Krause2026-03-11🤖 cs.AI

A Multi-Prototype-Guided Federated Knowledge Distillation Approach in AI-RAN Enabled Multi-Access Edge Computing System

本文针对 AI-RAN 赋能的多接入边缘计算系统中联邦学习面临的非独立同分布数据挑战,提出了一种通过引入条件层次凝聚聚类与原型对齐机制的多原型引导联邦知识蒸馏(MP-FedKD)方法,有效克服了单原型策略的信息丢失问题并显著提升了模型精度。

Luyao Zou, Hayoung Oh, Chu Myaet Thwal, Apurba Adhikary, Seohyeon Hong, Zhu Han2026-03-11🤖 cs.LG

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

该论文提出了一种名为“上下文强化学习验证(In-Context RLVR)”的新方法,通过利用模型自身的上下文学习能力生成“证据增益”信号来隐式地根据推理质量对奖励进行重加权,从而在无需外部评估器的情况下解决传统 RLVR 可能强化低质量推理路径的问题,显著提升了数学基准测试中的准确率与推理质量。

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG