CN-CBF: Composite Neural Control Barrier Function for Safe Robot Navigation in Dynamic Environments

Ce papier propose une méthode efficace de fonction barrière de contrôle neuronale composite (CN-CBF), combinant plusieurs réseaux de neurones entraînés via la théorie de l'atteignabilité de Hamilton-Jacobi et une architecture résiduelle, pour garantir une navigation robotique sûre dans des environnements dynamiques avec des taux de réussite supérieurs aux méthodes existantes sans augmenter la conservatisme.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Physics-Consistent Neural Networks for Learning Deformation and Director Fields in Microstructured Media with Loss-Based Validation Criteria

Cet article présente une approche combinant éléments finis et réseaux de neurones physiquement cohérents pour modéliser l'élasticité de Cosserat, intégrant des critères de validation basés sur la stabilité énergétique (quasi-convexité et inégalités de Legendre-Hadamard) pour garantir que les solutions apprises correspondent à des minimiseurs d'énergie stables.

Milad Shirani, Pete H. Gueldner, Murat Khidoyatov, Jeremy L. Warren, Federica Ninno2026-03-10🤖 cs.LG

Joint MDPs and Reinforcement Learning in Coupled-Dynamics Environments

Cet article propose les MDPs joints (JMDPs), un formalisme étendant les MDPs classiques pour modéliser les dépendances conjointes entre les contre-factuels d'actions via un modèle de transition multi-action, permettant ainsi le développement d'algorithmes de programmation dynamique et incrémentaux avec garanties de convergence pour les moments d'ordre supérieur des retours.

Ege C. Kaya, Mahsa Ghasemi, Abolfazl Hashemi2026-03-10🤖 cs.LG

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

Cette étude démontre que les représentations vectorielles (embeddings) de modèles fondationnels de l'ADN, partagées via des services EaaS, sont vulnérables à des attaques d'inversion permettant de reconstruire avec une grande précision les séquences génomiques sensibles, révélant ainsi des lacunes critiques dans la protection de la vie privée de ces outils.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

Cette étude démontre que la sparsification de graphes, en réduisant le nombre d'arêtes, constitue une étape de prétraitement légère et efficace qui accélère considérablement l'entraînement et l'inférence des réseaux de neurones graphiques (GNN) à grande échelle tout en préservant, voire en améliorant, leur précision.

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki Kalavri2026-03-10🤖 cs.LG

Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards

Le papier présente Chart-RL, une méthode d'apprentissage par renforcement utilisant des récompenses mathématiquement vérifiables qui améliore significativement la compréhension des graphiques par les modèles vision-langage, démontrant que la complexité des tâches d'entraînement est plus déterminante que le volume de données pour obtenir une généralisation robuste et des capacités de raisonnement transférables.

Xin Zhang, Xingyu Li, Rongguang Wang, Ruizhong Miao, Zheng Wang, Dan Roth, Chenyang Li2026-03-10🤖 cs.LG

A SISA-based Machine Unlearning Framework for Power Transformer Inter-Turn Short-Circuit Fault Localization

Cet article propose un cadre d'oubli machine basé sur la méthode SISA pour la localisation des courts-circuits entre spires dans les transformateurs de puissance, permettant de supprimer efficacement l'influence des données empoisonnées en réentraînant uniquement les sous-ensembles affectés plutôt que le modèle entier, ce qui réduit considérablement le temps de calcul tout en maintenant une précision de diagnostic équivalente.

Nanhong Liu, Jingyi Yan, Mucun Sun, Jie Zhang2026-03-10🤖 cs.LG

Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks

Cette étude présente un cadre d'apprentissage par renforcement sur graphes intégrant l'analyse topologique des données pour optimiser la reconfiguration et le délestage des réseaux de distribution d'électricité, améliorant ainsi significativement leur résilience face aux pannes et aux cyberattaques.

Roshni Anna Jacob, Prithvi Poddar, Jaidev Goel, Souma Chowdhury, Yulia R. Gel, Jie Zhang2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

Ce papier présente Diffusion Controller (DiffCon), un cadre unifié de théorie du contrôle qui reformule l'échantillonnage de diffusion inversée comme un problème de contrôle stochastique, permettant de développer des méthodes d'apprentissage par renforcement et une paramétrisation efficace par réseau secondaire pour améliorer l'alignement des préférences et l'efficacité de l'adaptation des modèles de diffusion préentraînés.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

Cet article propose un nouveau problème d'apprentissage en ligne appelé « Combinatorial Allocation Bandits » (CAB) pour les plateformes de mise en correspondance, qui vise à maximiser la satisfaction globale des utilisateurs plutôt que le simple nombre de correspondances, en développant et en évaluant des algorithmes basés sur la borne de confiance supérieure et l'échantillonnage de Thompson.

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji Ito2026-03-10🤖 cs.LG