Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本文提出了检索增强高斯头像(RAF),通过在训练期间引入从大规模无标签表情库中检索到的近邻表情来增强数据,从而在不依赖配对跨身份数据或架构修改的情况下,显著提升了无模板可驱动头像在未见表情驱动下的泛化能力与鲁棒性。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

该论文通过理论分析与实验证实,无监督强化学习中的内在奖励方法虽能短期提升模型,但受限于初始分布的“置信度 - 正确性”对齐问题而必然导致性能先升后降的崩溃,而基于计算不对称性的外部奖励方法则有望突破这一瓶颈。

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

该论文提出了名为"Impermanent"的实时基准测试框架,通过在持续更新的开源活动数据流上按序评估预测模型,旨在解决传统静态基准中存在的测试数据污染问题,从而更真实地衡量时间序列基础模型在开放世界动态变化下的时序泛化能力与鲁棒性。

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG