Optimistic Online Learning in Symmetric Cone Games

Ce papier introduit les jeux à cône symétrique comme cadre unificateur pour divers problèmes d'optimisation et de théorie des jeux, et propose l'algorithme OSCMWU, une méthode d'apprentissage en ligne optimiste qui calcule efficacement des équilibres de Nash avec une complexité itérative O~(1/ϵ)\tilde{\mathcal{O}}(1/\epsilon) en exploitant la forte convexité de l'entropie négative sur les cône symétriques.

Anas Barakat, Wayne Lin, John Lazarsfeld + 1 more2026-03-03🔢 math

Identifying and Evaluating Inactive Heads in Pretrained LLMs

Cette étude propose et évalue douze fonctions de score pour identifier les têtes d'attention inactives dans les grands modèles de langage, démontrant que plus de 12 % de ces têtes peuvent être supprimées sans perte significative de performance et que les méthodes basées uniquement sur les poids d'attention sous-estiment considérablement ce phénomène.

Pedro Sandoval-Segura, Xijun Wang, Ashwinee Panda + 4 more2026-03-03🤖 cs.LG

Sparsification Under Siege: Dual-Level Defense Against Poisoning in Communication-Efficient Federated Learning

Cet article présente SafeSparse, un cadre de défense à double niveau qui résout le compromis entre robustesse et efficacité communicationnelle dans l'apprentissage fédéré en utilisant une calibration structurelle et un alignement sémantique directionnel pour contrer les attaques par empoisonnement lors de la sparsification des gradients.

Zhiyong Jin, Runhua Xu, Chao Li + 3 more2026-03-03🤖 cs.LG

Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch

Cette étude révèle que les modèles de recommandation basés sur la diffusion, malgré leur complexité, sont systématiquement surpassés par des approches plus simples en raison de problèmes méthodologiques persistants et d'un inadéquation conceptuelle avec la tâche de recommandation top-N, appelant ainsi à un changement radical dans la culture de recherche du domaine.

Michael Benigni, Maurizio Ferrari Dacrema, Dietmar Jannach2026-03-03🤖 cs.LG

ARCANE -- Early Detection of Interplanetary Coronal Mass Ejections

Cet article présente ARCANE, un cadre innovant utilisant le modèle ResUNet++ pour détecter précocement les éjections de masse coronale interplanétaires dans les flux de données solaires en temps réel, permettant une identification fiable des événements avant leur observation complète avec un léger compromis sur la précision par rapport aux données scientifiques haute résolution.

H. T. Rüdisser, G. Nguyen, J. Le Louëdec + 2 more2026-03-03🔭 astro-ph

DRA-GRPO: Your GRPO Needs to Know Diverse Reasoning Paths for Mathematical Reasoning

Cet article présente DRA-GRPO, une méthode plug-and-play qui améliore le raisonnement mathématique des LLMs en corrigeant l'inconsistance diversité-qualité du GRPO standard grâce à un ajustement de récompense basé sur la densité sémantique et l'information mutuelle sousmodulaire, permettant d'atteindre des performances supérieures avec peu de données et un coût réduit.

Xiwen Chen, Wenhui Zhu, Peijie Qiu + 7 more2026-03-03💬 cs.CL

Back to Square Roots: An Optimal Bound on the Matrix Factorization Error for Multi-Epoch Differentially Private SGD

Cet article présente la méthode de factorisation BISR (Banded Inverse Square Root), qui établit une borne optimale asymptotique pour l'erreur de factorisation matricielle dans l'apprentissage fédéré privé différentiellement sur plusieurs époques, tout en offrant une mise en œuvre plus simple et efficace que les méthodes existantes.

Nikita P. Kalinin, Ryan McKenna, Jalaj Upadhyay + 1 more2026-03-03🤖 cs.LG

Adversarially Pretrained Transformers May Be Universally Robust In-Context Learners

Cette étude présente une analyse théorique démontrant que les transformateurs pré-entraînés de manière adversariale peuvent agir comme des modèles fondateurs universellement robustes, capables de s'adapter de manière résiliente à diverses tâches en aval via l'apprentissage contextuel sans nécessiter de réentraînement adversarial supplémentaire.

Soichiro Kumano, Hiroshi Kera, Toshihiko Yamasaki2026-03-03📊 stat