Effective Sample Size and Generalization Bounds for Temporal Networks

Cet article propose une méthodologie d'évaluation dépendante de la structure temporelle pour les réseaux de convolution temporels, démontrant que le contrôle de la taille d'échantillon effective plutôt que de la longueur brute permet d'obtenir des garanties de généralisation plus précises et révèle que la dépendance temporelle peut paradoxalement réduire l'écart de généralisation.

Barak Gahtan, Alex M. Bronstein2026-03-05🤖 cs.AI

Subsampling Factorization Machine Annealing

Cet article présente le Subsampling Factorization Machine Annealing (SFMA), un algorithme d'optimisation hybride quantique-ML qui améliore la vitesse et la précision du Factorization Machine Annealing en utilisant des sous-ensembles de données pour équilibrer l'exploration et l'exploitation, permettant ainsi de résoudre efficacement des problèmes d'optimisation à grande échelle avec un faible coût computationnel.

Yusuke Hama, Tadashi Kadowaki2026-03-05⚛️ quant-ph

On the Generalization Limits of Quantum Generative Adversarial Networks with Pure State Generators

Cette étude démontre que les réseaux antagonistes génératifs quantiques (QGAN) utilisant des générateurs d'états purs peinent à généraliser au-delà de la moyenne des données d'entraînement, une limitation expliquée théoriquement par une borne inférieure de la qualité du discriminateur basée sur la fidélité entre l'état généré et la distribution cible.

Jasmin Frkatovic, Akash Malemath, Ivan Kankeu + 7 more2026-03-05⚛️ quant-ph

Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

Ce papier présente la zono-conformalité, une nouvelle méthode d'quantification d'incertitude qui utilise des zonotopes intégrés directement dans le modèle pour fournir des ensembles de prédictions avec garanties de couverture statistique, tout en étant plus efficace et moins conservatrice que les approches conformes traditionnelles pour les tâches de régression et de classification.

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer + 1 more2026-03-05🤖 cs.AI

Performance Assessment Strategies for Generative AI Applications in Healthcare

Cet article examine les stratégies d'évaluation des applications de l'intelligence artificielle générative en santé, en soulignant les limites des benchmarks quantitatifs actuels et en mettant en avant l'importance des méthodologies intégrant l'expertise humaine et des modèles de calcul économiques pour garantir une généralisation fiable dans les environnements cliniques réels.

Victor Garcia, Mariia Sidulova, Aldo Badano2026-03-05🤖 cs.AI

Deep Hierarchical Learning with Nested Subspace Networks for Large Language Models

Cet article propose les Réseaux à Sous-Espaces Emboîtés (NSN), une nouvelle architecture qui permet d'ajuster dynamiquement et de manière granulaire un seul grand modèle de langage pré-entraîné à différentes contraintes de calcul lors de l'inférence, offrant ainsi un compromis fluide et prévisible entre performance et efficacité sans nécessiter l'entraînement de multiples modèles spécialisés.

Paulius Rauba, Mihaela van der Schaar2026-03-05🤖 cs.LG

Bridging Computational Social Science and Deep Learning: Cultural Dissemination-Inspired Graph Neural Networks

Ce papier présente AxelGNN, une architecture innovante de réseaux de neurones à graphes inspirée du modèle de dissémination culturelle d'Axelrod qui résout les problèmes de lissage excessif et d'agrégation monolithique en gérant simultanément les graphes homophiles et hétérophiles grâce à des interactions gérées par similarité, un copiage de caractéristiques par segments et une polarisation globale.

Asela Hevapathige2026-03-05🤖 cs.AI

Best-of-\infty -- Asymptotic Performance of Test-Time LLM Ensembling

Cet article propose une méthode d'inférence adaptative pour l'ensemblage de grands modèles de langage par vote majoritaire, qui étend l'analyse asymptotique du « meilleur parmi N » à l'infini et optimise les pondérations d'ensembles hétérogènes via un programme linéaire en nombres entiers pour maximiser les performances avec un budget de calcul limité.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Cet article propose une méthode agentic utilisant des modèles de langage dotés de capacités de raisonnement pour induire des arbres de décision légers et interprétables à partir de petits jeux de données tabulaires, offrant des performances compétitives par rapport aux modèles boîte noire tout en garantissant la transparence et le respect de contraintes d'équité.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

Le papier présente Uni-NTFM, un modèle fondamental unifié pour l'apprentissage de représentations EEG qui, inspiré par les mécanismes neuronaux biologiques, intègre des modules de projection hétérogène, des embeddings topologiques et un réseau de transformateurs à mélange d'experts pour surpasser les modèles existants sur neuf tâches de décodage cérébral.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

Cette étude de benchmarking révèle que les modèles fondationnels ECG, en particulier l'architecture compacte ECG-CPC, surpassent les bases supervisées en efficacité des labels et démontrent que les biais architecturaux sont plus déterminants que l'échelle massive pour la généralisation sur des tâches cliniques variées, tout en soulignant les lacunes persistantes dans la prédiction des structures cardiaques et des résultats.

M A Al-Masud, Juan Miguel Lopez Alcaraz, Nils Strodthoff2026-03-05🤖 cs.LG