Silence the Judge: Reinforcement Learning with Self-Verifier via Latent Geometric Clustering

Ce papier propose Latent-GRPO, un cadre d'apprentissage par renforcement qui élimine le besoin de vérificateurs externes coûteux en exploitant la géométrie de l'espace latent pour générer des récompenses intrinsèques continues via un algorithme d'estimation de centroïde robuste, permettant ainsi d'accélérer l'entraînement des modèles de langage de plus de deux fois tout en maintenant leurs performances.

Nonghai Zhang, Weitao Ma, Zhanyu Ma + 5 more2026-03-03💬 cs.CL

GNN Explanations that do not Explain and How to find Them

Cet article révèle que les explications fournies par les réseaux de neurones graphiques auto-explicatifs (SE-GNN) peuvent être fondamentalement déconnectées de la logique de prédiction du modèle, même en cas de performance optimale, et propose une nouvelle métrique de fidélité pour détecter ces défaillances dégénérées, qu'elles soient malveillantes ou naturelles.

Steve Azzolin, Stefano Teso, Bruno Lepri + 2 more2026-03-03🤖 cs.AI

Learning to Explore with Parameter-Space Noise: A Deep Dive into Parameter-Space Noise for Reinforcement Learning with Verifiable Rewards

Ce papier propose PSN-RLVR, une méthode qui améliore l'exploration dans l'apprentissage par renforcement avec récompenses vérifiables en perturbant les paramètres du modèle plutôt que les actions, permettant ainsi de découvrir de nouvelles stratégies de raisonnement et d'obtenir de meilleures performances sur des tâches mathématiques complexes.

Bizhe Bai, Xinyue Wang, Peng Ye + 1 more2026-03-03🤖 cs.AI

Relaxed Triangle Inequality for Kullback-Leibler Divergence Between Multivariate Gaussian Distributions

Cet article établit la borne supérieure exacte de la divergence de Kullback-Leibler entre trois distributions gaussiennes multivariées satisfaisant une inégalité triangulaire relâchée, comblant ainsi une lacune théorique et démontrant son utilité pour la détection de données hors distribution et l'apprentissage par renforcement sûr.

Shiji Xiao, Yufeng Zhang, Chubo Liu + 3 more2026-03-03📊 stat