Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Cet article présente un cadre d'apprentissage par renforcement hybride basé sur la croyance (HBRL) qui combine l'inférence spatiale par processus de Cox log-Gaussien et l'apprentissage par renforcement profond pour optimiser l'exploration coordonnée de plusieurs agents, démontrant une convergence plus rapide et des performances supérieures dans des tâches de fourniture de services sans fil.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

Riemannian Optimization in Modular Systems

Cet article propose une approche théorique et pratique pour l'optimisation de systèmes modulaires, notamment les réseaux de neurones, en combinant la géométrie riemannienne, la théorie du contrôle optimal et la physique théorique pour dériver une nouvelle méthode de descente de gradient récursive et stable qui améliore la compréhension et l'efficacité de l'apprentissage par rapport aux algorithmes traditionnels comme la rétropropagation.

Christian Pehle, Jean-Jacques Slotine2026-03-05🤖 cs.LG

Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm

Cette étude propose un cadre d'apprentissage par renforcement basé sur un Double Deep Q-Network (DDQN) et une expérience priorisée pour prédire les épisodes de gel de la marche chez les patients parkinsoniens avec un horizon d'avertissement allant jusqu'à 8,72 secondes, permettant ainsi des interventions proactives personnalisées.

Septian Enggar Sukmana, Sang Won Bae, Tomohiro Shibata2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Cet article établit des bornes d'erreur d'échantillonnage fini pour les modèles de diffusion basés sur l'appariement de scores, démontrant que leur taux de convergence dépend de la dimension intrinsèque des données plutôt que de la dimension ambiante, permettant ainsi de surmonter la malédiction de la dimensionnalité sans hypothèses restrictives de support compact ou de régularité.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

Le papier présente JANUS, un cadre de génération de données synthétiques basé sur un graphe causal de trees de décision bayésiens qui résout le dilemme quadruple de la fidélité, du contrôle des contraintes, de l'estimation d'incertitude et de l'efficacité grâce à une rétropropagation inverse garantissant une satisfaction à 100 % des contraintes et une décomposition analytique de l'incertitude.

Taha Racicot2026-03-05🤖 cs.AI