Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

Cet article démontre que les mécanismes de porte dans les réseaux de neurones récurrents agissent comme des préconditionneurs de l'optimisation pilotés par les données, en couplant les échelles de temps des états et des paramètres pour générer des taux d'apprentissage effectifs dépendants du délai et de la direction, ce qui explique la robustesse de l'entraînement de ces architectures.

Lorenzo Livi2026-03-10🤖 cs.LG

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Cet article présente un algorithme d'apprentissage par jeu dynamique inverse utilisant des programmes linéaires en nombres entiers mixtes pour inférer des contraintes paramétriques à partir de démonstrations d'équilibres de Nash locaux, garantissant théoriquement l'approximation des ensembles sûrs et permettant de concevoir des trajectoires interactives robustes pour des agents à dynamique non linéaire.

Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou2026-03-10🤖 cs.LG

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

Cette étude propose un modèle de diffusion latent conditionnel (CbLDM) qui utilise des priors conditionnels et une matrice Laplacienne pour résoudre de manière stable le problème inverse de reconstruction des nanostructures de nanoparticules métalliques à partir de leur fonction de distribution de paires atomiques.

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Simon J. L. Billinge, Ran Gu2026-03-10🔬 cond-mat.mtrl-sci

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

Cet article propose un cadre d'apprentissage unifié combinant un curriculum piloté par l'entropie et un apprentissage multi-tâches pour améliorer la prédiction de la mobilité humaine en organisant l'entraînement du simple au complexe et en intégrant des signaux d'apprentissage auxiliaires pour la distance et la direction, atteignant ainsi des performances de pointe lors du défi HuMob.

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Cette étude démontre que les méthodes d'imputation par équations chaînées (MICE) constituent une alternative efficace et plus simple à mettre en œuvre que les réseaux antagonistes génératifs et les autoencodeurs pour la génération de données synthétiques en tarification actuarielle, tout en préservant fidèlement les distributions et les relations multivariées nécessaires à l'entraînement de modèles GLM.

Yevhen Havrylenko, Meelis Käärik, Artur Tuttar2026-03-10🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Cet article propose une classe de méthodes F²SA-pp utilisant des différences finies d'ordre pp pour l'optimisation stochastique bi-niveau, améliorant la complexité de recherche d'un point stationnaire à O~(pϵ4p/2)\tilde{\mathcal{O}}(p \epsilon^{-4-p/2}) pour des problèmes hautement lisses et démontrant que cette borne est presque optimale.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao Zhang2026-03-10🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Cette étude démontre une asymétrie fondamentale dans l'inférence comportementale à grande échelle, où les motivations sont déduites avec une précision quasi parfaite (98-100 %) tandis que les systèmes de croyances restent largement indétectables (plafonnant à 49 % même avec des architectures avancées), révélant que la limite de l'inférence réside dans l'ambiguïté structurelle des croyances plutôt que dans les capacités des modèles.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Cet article présente un cadre modulaire multimodal utilisant l'intelligence artificielle générative pour produire de manière accessible et réaliste des données synthétiques sur les bâtiments résidentiels à partir d'images publiques, afin de réduire la dépendance aux sources de données coûteuses ou restreintes pour la recherche en simulation énergétique.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Ce papier présente PANO, un opérateur neuronal physique-aware capable d'inverser directement les mesures brutes en images 3D de tomographie photoacoustique avec une haute précision et en temps réel, surpassant les méthodes traditionnelles et facilitant ainsi le passage vers des systèmes cliniques accessibles.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Cet article présente une méthode combinant l'apprentissage profond et les conductances d'entrée dynamiques (DIC) pour reconstruire rapidement et efficacement des populations dégénérées de modèles de neurones à base de conductance à partir uniquement des temps de décharge, en surmontant le défi de l'inférence des paramètres biophysiques malgré la variabilité des canaux ioniques.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

Ce papier présente ORIC, un cadre et une nouvelle évaluation (ORIC-Bench) conçus pour analyser et améliorer la capacité des grands modèles vision-langage à reconnaître des objets dans des contextes incongrus, en démontrant que ces situations augmentent les erreurs d'hallucination et en proposant une méthode d'ajustement fin par renforcement visuel pour y remédier.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Cet article propose une méthode d'apprentissage de fonctions de barrière neuronales conditionnées par l'observation, fondée sur l'analyse de la faisabilité de Hamilton-Jacobi et une architecture de type hyper-réseau, qui garantit des ensembles sûrs optimaux et améliore la sécurité des systèmes autonomes dans des environnements partiellement observables.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

Ce papier présente AEGIS, un cadre d'augmentation basé uniquement sur les arêtes qui améliore la prédiction de liens dans les graphes de connaissances bipartis clairsemés en rééchantillonnant les arêtes existantes ou en utilisant une augmentation sémantique KNN, évitant ainsi la création de fausses connexions tout en préservant l'authenticité des données.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Le papier présente Aurora, un modèle fondamental multimodal pour la prévision de séries temporelles qui, grâce à son entraînement sur un corpus cross-domaine et l'intégration de connaissances textuelles et visuelles via une attention guidée et un matching de flux prototype, réalise une inférence zero-shot et des performances state-of-the-art sur divers benchmarks.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Ce papier présente les GDR-learners, une nouvelle famille d'apprentissages génératifs orthogonaux et doublement robustes qui, en s'inspirant de modèles d'état de l'art comme les flux normalisants conditionnels et les modèles de diffusion, permettent d'estimer de manière asymptotiquement optimale les distributions des résultats potentiels à partir de données observationnelles.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

Le papier présente CLAD-Net, un cadre d'apprentissage continu intégrant un transformateur auto-supervisé et une distillation de connaissances pour permettre aux modèles de reconnaissance d'activités portables de s'adapter aux nouveaux sujets sans oublier les tâches précédentes, tout en restant performants malgré la rareté des données étiquetées.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG