cs.LG articles | Gist.Science

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Cet article présente un cadre d'apprentissage par renforcement hybride basé sur la croyance (HBRL) qui combine l'inférence spatiale par processus de Cox log-Gaussien et l'apprentissage par renforcement profond pour optimiser l'exploration coordonnée de plusieurs agents, démontrant une convergence plus rapide et des performances supérieures dans des tâches de fourniture de services sans fil.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Ce papier présente MEM, une architecture de mémoire multi-échelle combinant des représentations vidéo à court terme et textuelles à long terme pour permettre aux modèles d'action visuelle et linguistique d'exécuter des tâches robotiques complexes s'étendant sur de longues périodes.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

NuMuon: Nuclear-Norm-Constrained Muon for Compressible LLM Training

Ce papier présente NuMuon, un optimiseur qui ajoute une contrainte de norme nucléaire à Muon pour renforcer la structure de faible rang des poids des grands modèles de langage, améliorant ainsi leur compressibilité et leur qualité après compression tout en conservant une convergence efficace.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 7 more2026-03-05🤖 cs.LG

Riemannian Optimization in Modular Systems

Cet article propose une approche théorique et pratique pour l'optimisation de systèmes modulaires, notamment les réseaux de neurones, en combinant la géométrie riemannienne, la théorie du contrôle optimal et la physique théorique pour dériver une nouvelle méthode de descente de gradient récursive et stable qui améliore la compréhension et l'efficacité de l'apprentissage par rapport aux algorithmes traditionnels comme la rétropropagation.

Christian Pehle, Jean-Jacques Slotine2026-03-05🤖 cs.LG

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Les auteurs proposent un cadre rigoureux étendant les opérateurs neuronaux aux fonctions hors distribution en exploitant les espaces de Hilbert à noyau reproduisant pour garantir la précision des valeurs et des dérivées, méthode validée par la résolution d'équations aux dérivées partielles elliptiques sur des variétés.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Cet article établit la convergence forte d'ordre 1/2 d'un schéma d'Euler-Maruyama géométrique pour les équations différentielles stochastiques sur les variétés riemanniennes, fournissant ainsi une borne de Wasserstein pour l'échantillonnage via la dynamique de Langevin riemannienne.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

Adaptive Sensing of Continuous Physical Systems for Machine Learning

Cet article propose un cadre de calcul général intégrant un module d'attention entraînable pour optimiser l'extraction d'informations à partir de systèmes dynamiques physiques, démontrant que l'adaptation de la localisation des capteurs améliore significativement la précision des prédictions dans des contextes chaotiques.

Felix Köster, Atsushi Uchida2026-03-05🤖 cs.LG

Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm

Cette étude propose un cadre d'apprentissage par renforcement basé sur un Double Deep Q-Network (DDQN) et une expérience priorisée pour prédire les épisodes de gel de la marche chez les patients parkinsoniens avec un horizon d'avertissement allant jusqu'à 8,72 secondes, permettant ainsi des interventions proactives personnalisées.

Septian Enggar Sukmana, Sang Won Bae, Tomohiro Shibata2026-03-05🤖 cs.LG

Graph Negative Feedback Bias Correction Framework for Adaptive Heterophily Modeling

Ce papier propose le cadre GNFBC, qui corrige le biais d'autocorrélation des étiquettes inhérent aux réseaux de neurones graphiques traditionnels en intégrant un mécanisme de rétroaction négative pour améliorer les performances sur les graphes hétérophiles.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Cet article formalise l'apprentissage de la communication dans les environnements partiellement observables en utilisant la théorie des structures d'information pour identifier des cas quasi-classiques traitables et proposer des algorithmes d'apprentissage et de planification avec des complexités garanties.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

Machine Pareidolia: Protecting Facial Image with Emotional Editing

Ce papier présente MAP, une méthode innovante de protection de la vie privée qui utilise des modifications émotionnelles pour masquer les identités faciales tout en garantissant une haute fidélité visuelle et une robustesse supérieure face aux systèmes de reconnaissance faciale, y compris dans des scénarios démographiques et photographiques variés.

Binh M. Le, Simon S. Woo2026-03-05🤖 cs.LG

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Ce papier propose LSMR, un algorithme qui exploite la localité induite par le modèle pour réduire la complexité du calcul de la valeur de Shapley en réutilisant optimalement l'entraînement sur des sous-ensembles de données pertinents, permettant ainsi une estimation rapide et précise sans perte de fidélité.

Xuan Yang, Hsi-Wen Chen, Ming-Syan Chen + 1 more2026-03-05🤖 cs.AI

A Stein Identity for q-Gaussians with Bounded Support

Cet article propose une nouvelle identité de Stein pour les distributions q-Gaussiennes à support borné, en étendant les théorèmes de Bonnet et Price via des distributions d'escorte pour obtenir des estimateurs de gradient simples et à faible variance applicables à l'apprentissage bayésien et à la minimisation de la sensibilité.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

CONCUR: Benchmarking LLMs for Concurrent Code Generation

Cet article présente CONCUR, un nouveau benchmark conçu pour évaluer les capacités des modèles de langage à générer du code concurrent, comblant ainsi une lacune des évaluations actuelles qui se concentrent principalement sur le code séquentiel.

Jue Huang, Tarek Mahmud, Corina Pasareanu + 1 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Cet article établit des bornes d'erreur d'échantillonnage fini pour les modèles de diffusion basés sur l'appariement de scores, démontrant que leur taux de convergence dépend de la dimension intrinsèque des données plutôt que de la dimension ambiante, permettant ainsi de surmonter la malédiction de la dimensionnalité sans hypothèses restrictives de support compact ou de régularité.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Why Do Unlearnable Examples Work: A Novel Perspective of Mutual Information

Cet article propose une nouvelle méthode d'exemples inapprenables, MI-UE, fondée sur la réduction de l'information mutuelle via la maximisation de la similarité cosinus des caractéristiques intra-classe, démontrant ainsi théoriquement et expérimentalement une efficacité supérieure aux approches existantes pour protéger la vie privée des données.

Yifan Zhu, Yibo Miao, Yinpeng Dong + 1 more2026-03-05🤖 cs.AI

JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

Le papier présente JANUS, un cadre de génération de données synthétiques basé sur un graphe causal de trees de décision bayésiens qui résout le dilemme quadruple de la fidélité, du contrôle des contraintes, de l'estimation d'incertitude et de l'efficacité grâce à une rétropropagation inverse garantissant une satisfaction à 100 % des contraintes et une décomposition analytique de l'incertitude.

Taha Racicot2026-03-05🤖 cs.AI

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Le papier présente MOOSE-Star, un cadre unifié qui rend l'entraînement tractable pour la découverte scientifique en surmontant la barrière de la complexité combinatoire grâce à une recherche hiérarchique guidée et à un apprentissage sur des tâches décomposées, réduisant ainsi la complexité de exponentielle à logarithmique.

Zonglin Yang, Lidong Bing2026-03-05🤖 cs.LG

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Cet article propose un cadre d'apprentissage alternatif, nommé ALTERNATING-MARL, pour les jeux coopératifs à grand nombre d'agents sous contraintes de communication, démontrant sa convergence vers une équation de Nash approchée avec une complexité d'échantillonnage réduite grâce à une subsampling de champ moyen.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

Harmonic Dataset Distillation for Time Series Forecasting

Cet article propose HDT, une méthode de distillation de dataset pour la prévision de séries temporelles qui décompose les données dans le domaine fréquentiel via la FFT pour préserver les dépendances temporelles et améliorer la généralisation et l'évolutivité.

Seungha Hong, Sanghwan Jang, Wonbin Kweon + 3 more2026-03-05🤖 cs.LG

← Précédent Suivant →