Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

Cette étude démontre que la sparsification de graphes, en réduisant le nombre d'arêtes, constitue une étape de prétraitement légère et efficace qui accélère considérablement l'entraînement et l'inférence des réseaux de neurones graphiques (GNN) à grande échelle tout en préservant, voire en améliorant, leur précision.

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki Kalavri2026-03-10🤖 cs.LG

Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards

Le papier présente Chart-RL, une méthode d'apprentissage par renforcement utilisant des récompenses mathématiquement vérifiables qui améliore significativement la compréhension des graphiques par les modèles vision-langage, démontrant que la complexité des tâches d'entraînement est plus déterminante que le volume de données pour obtenir une généralisation robuste et des capacités de raisonnement transférables.

Xin Zhang, Xingyu Li, Rongguang Wang, Ruizhong Miao, Zheng Wang, Dan Roth, Chenyang Li2026-03-10🤖 cs.LG

A SISA-based Machine Unlearning Framework for Power Transformer Inter-Turn Short-Circuit Fault Localization

Cet article propose un cadre d'oubli machine basé sur la méthode SISA pour la localisation des courts-circuits entre spires dans les transformateurs de puissance, permettant de supprimer efficacement l'influence des données empoisonnées en réentraînant uniquement les sous-ensembles affectés plutôt que le modèle entier, ce qui réduit considérablement le temps de calcul tout en maintenant une précision de diagnostic équivalente.

Nanhong Liu, Jingyi Yan, Mucun Sun, Jie Zhang2026-03-10🤖 cs.LG

Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks

Cette étude présente un cadre d'apprentissage par renforcement sur graphes intégrant l'analyse topologique des données pour optimiser la reconfiguration et le délestage des réseaux de distribution d'électricité, améliorant ainsi significativement leur résilience face aux pannes et aux cyberattaques.

Roshni Anna Jacob, Prithvi Poddar, Jaidev Goel, Souma Chowdhury, Yulia R. Gel, Jie Zhang2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

Ce papier présente Diffusion Controller (DiffCon), un cadre unifié de théorie du contrôle qui reformule l'échantillonnage de diffusion inversée comme un problème de contrôle stochastique, permettant de développer des méthodes d'apprentissage par renforcement et une paramétrisation efficace par réseau secondaire pour améliorer l'alignement des préférences et l'efficacité de l'adaptation des modèles de diffusion préentraînés.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

Cet article propose un nouveau problème d'apprentissage en ligne appelé « Combinatorial Allocation Bandits » (CAB) pour les plateformes de mise en correspondance, qui vise à maximiser la satisfaction globale des utilisateurs plutôt que le simple nombre de correspondances, en développant et en évaluant des algorithmes basés sur la borne de confiance supérieure et l'échantillonnage de Thompson.

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji Ito2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Le papier présente RESCHED, un cadre d'apprentissage par renforcement profond minimaliste basé sur l'architecture Transformer qui, en réduisant l'espace d'état à quatre caractéristiques essentielles et en éliminant les dépendances historiques, surpasse les méthodes existantes pour résoudre le problème d'ordonnancement flexible d'atelier tout en assurant une forte généralisation à d'autres variantes d'ordonnancement.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication

Ce papier présente Artoo, un système de communication acoustique robot-à-robot optimisé de bout en bout qui remplace le traitement du signal traditionnel par des réseaux de neurones co-entraînés pour maximiser la précision de décodage dans des environnements bruyants tout en restant léger et rapide pour une intégration sur des plateformes robotiques aux ressources limitées.

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik2026-03-10🤖 cs.LG

Entropy-Aware On-Policy Distillation of Language Models

Cet article propose une distillation en ligne consciente de l'entropie qui améliore la diversité de génération et l'alignement élève-enseignant en adaptant dynamiquement l'objectif de divergence KL en fonction de l'incertitude du modèle enseignant, ce qui se traduit par des gains significatifs de performance sur des benchmarks de raisonnement mathématique.

Woogyeol Jin, Taywon Min, Yongjin Yang, Swanand Ravindra Kadhe, Yi Zhou, Dennis Wei, Nathalie Baracaldo, Kimin Lee2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

Ce papier propose VLN-Cache, un cadre de mise en cache de tokens qui améliore l'efficacité de l'inférence des modèles de navigation vision-langage en adaptant dynamiquement la réutilisation des tokens aux changements de vue et d'importance sémantique, permettant ainsi une accélération significative sans compromettre les performances de navigation.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG