cs.LG articles | Gist.Science

Effective Sample Size and Generalization Bounds for Temporal Networks

Cet article propose une méthodologie d'évaluation dépendante de la structure temporelle pour les réseaux de convolution temporels, démontrant que le contrôle de la taille d'échantillon effective plutôt que de la longueur brute permet d'obtenir des garanties de généralisation plus précises et révèle que la dépendance temporelle peut paradoxalement réduire l'écart de généralisation.

Barak Gahtan, Alex M. Bronstein2026-03-05🤖 cs.AI

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering

Ce papier présente ObfusQAte, un cadre novateur conçu pour évaluer la robustesse des modèles de langage face à des questions factuelles obfusquées, révélant ainsi leur tendance à échouer ou à halluciner lorsqu'ils sont confrontés à des variations linguistiques subtiles.

Shubhra Ghosh, Abhilekh Borah, Aditya Kumar Guru + 1 more2026-03-05🤖 cs.AI

Subsampling Factorization Machine Annealing

Cet article présente le Subsampling Factorization Machine Annealing (SFMA), un algorithme d'optimisation hybride quantique-ML qui améliore la vitesse et la précision du Factorization Machine Annealing en utilisant des sous-ensembles de données pour équilibrer l'exploration et l'exploitation, permettant ainsi de résoudre efficacement des problèmes d'optimisation à grande échelle avec un faible coût computationnel.

Yusuke Hama, Tadashi Kadowaki2026-03-05⚛️ quant-ph

On the Generalization Limits of Quantum Generative Adversarial Networks with Pure State Generators

Cette étude démontre que les réseaux antagonistes génératifs quantiques (QGAN) utilisant des générateurs d'états purs peinent à généraliser au-delà de la moyenne des données d'entraînement, une limitation expliquée théoriquement par une borne inférieure de la qualité du discriminateur basée sur la fidélité entre l'état généré et la distribution cible.

Jasmin Frkatovic, Akash Malemath, Ivan Kankeu + 7 more2026-03-05⚛️ quant-ph

Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

Ce papier présente la zono-conformalité, une nouvelle méthode d'quantification d'incertitude qui utilise des zonotopes intégrés directement dans le modèle pour fournir des ensembles de prédictions avec garanties de couverture statistique, tout en étant plus efficace et moins conservatrice que les approches conformes traditionnelles pour les tâches de régression et de classification.

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer + 1 more2026-03-05🤖 cs.AI

Adaptive Quantized Planetary Crater Detection System for Autonomous Space Exploration

Cet article de concept propose l'Adaptive Quantized Planetary Crater Detection System (AQ-PCDSys), une architecture intégrant un réseau de neurones quantifié et une fusion adaptative de capteurs pour permettre une détection de cratères planétaires en temps réel sur du matériel spatial aux ressources limitées.

Aditri Paul, Archan Paul2026-03-05🤖 cs.AI

Performance Assessment Strategies for Generative AI Applications in Healthcare

Cet article examine les stratégies d'évaluation des applications de l'intelligence artificielle générative en santé, en soulignant les limites des benchmarks quantitatifs actuels et en mettant en avant l'importance des méthodologies intégrant l'expertise humaine et des modèles de calcul économiques pour garantir une généralisation fiable dans les environnements cliniques réels.

Victor Garcia, Mariia Sidulova, Aldo Badano2026-03-05🤖 cs.AI

QDFlow: A Python package for physics simulations of quantum dot devices

QDFlow est un simulateur physique open-source en Python conçu pour générer des données synthétiques réalistes et étiquetées sur des dispositifs de boîtes quantiques, afin de pallier le manque de données expérimentales et de faciliter le développement et le benchmarking de modèles d'apprentissage automatique.

Donovan L. Buterakos, Sandesh S. Kalantre, Joshua Ziegler + 2 more2026-03-05⚛️ quant-ph

Segment-to-Act: Label-Noise-Robust Action-Prompted Video Segmentation Towards Embodied Intelligence

Cet article présente ActiSeg-NL, le premier benchmark évaluant la robustesse de la segmentation vidéo d'objets basée sur l'action face au bruit d'étiquetage textuel et de masques, et propose une analyse approfondie des stratégies d'apprentissage ainsi qu'un nouveau mécanisme de tête de masque parallèle (PMHM) pour y remédier.

Wenxin Li, Kunyu Peng, Di Wen + 4 more2026-03-05🤖 cs.LG

Deep Hierarchical Learning with Nested Subspace Networks for Large Language Models

Cet article propose les Réseaux à Sous-Espaces Emboîtés (NSN), une nouvelle architecture qui permet d'ajuster dynamiquement et de manière granulaire un seul grand modèle de langage pré-entraîné à différentes contraintes de calcul lors de l'inférence, offrant ainsi un compromis fluide et prévisible entre performance et efficacité sans nécessiter l'entraînement de multiples modèles spécialisés.

Paulius Rauba, Mihaela van der Schaar2026-03-05🤖 cs.LG

Bridging Computational Social Science and Deep Learning: Cultural Dissemination-Inspired Graph Neural Networks

Ce papier présente AxelGNN, une architecture innovante de réseaux de neurones à graphes inspirée du modèle de dissémination culturelle d'Axelrod qui résout les problèmes de lissage excessif et d'agrégation monolithique en gérant simultanément les graphes homophiles et hétérophiles grâce à des interactions gérées par similarité, un copiage de caractéristiques par segments et une polarisation globale.

Asela Hevapathige2026-03-05🤖 cs.AI

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Cet article propose une méthode d'inférence adaptative pour l'ensemblage de grands modèles de langage par vote majoritaire, qui étend l'analyse asymptotique du « meilleur parmi N » à l'infini et optimise les pondérations d'ensembles hétérogènes via un programme linéaire en nombres entiers pour maximiser les performances avec un budget de calcul limité.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization

Ce papier présente CAD-Tokenizer, un cadre innovant utilisant un VQ-VAE séquentiel et un décodage contraint pour tokeniser les données CAD au niveau des primitives, permettant ainsi une génération et une édition de modèles assistés par texte bien plus efficaces que les approches antérieures.

Ruiyu Wang, Shizhao Sun, Weijian Ma + 1 more2026-03-05🤖 cs.LG

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Cet article propose une méthode agentic utilisant des modèles de langage dotés de capacités de raisonnement pour induire des arbres de décision légers et interprétables à partir de petits jeux de données tabulaires, offrant des performances compétitives par rapport aux modèles boîte noire tout en garantissant la transparence et le respect de contraintes d'équité.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Scalable Second-order Riemannian Optimization for $K$ -means Clustering

Cet article propose une nouvelle formulation de l'algorithme de clustering K-means comme un problème d'optimisation lisse sur une sous-variété, résolu efficacement par un algorithme de Newton riemannien régularisé au cube qui garantit une convergence rapide et une précision statistique optimale.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

Erase or Hide? Suppressing Spurious Unlearning Neurons for Robust Unlearning

Ce papier présente Ssiuu, une nouvelle méthode d'effacement qui, contrairement aux approches actuelles qui masquent simplement les connaissances sensibles via des neurones d'effacement spurius, garantit une suppression fidèle et robuste des données privées pour prévenir leur réapprentissage.

Nakyeong Yang, Dong-Kyum Kim, Jea Kwon + 3 more2026-03-05🤖 cs.LG

The Lie of the Average: How Class Incremental Learning Evaluation Deceives You?

Ce papier propose EDGE, un nouveau protocole d'évaluation pour l'apprentissage incrémental de classes qui identifie des séquences extrêmes basées sur la similarité inter-tâches afin de corriger les biais des méthodes actuelles et de fournir une estimation précise de la distribution complète des performances.

Guannan Lai, Da-Wei Zhou, Xin Yang + 1 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

Le papier présente Uni-NTFM, un modèle fondamental unifié pour l'apprentissage de représentations EEG qui, inspiré par les mécanismes neuronaux biologiques, intègre des modules de projection hétérogène, des embeddings topologiques et un réseau de transformateurs à mélange d'experts pour surpasser les modèles existants sur neuf tâches de décodage cérébral.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

Cette étude de benchmarking révèle que les modèles fondationnels ECG, en particulier l'architecture compacte ECG-CPC, surpassent les bases supervisées en efficacité des labels et démontrent que les biais architecturaux sont plus déterminants que l'échelle massive pour la généralisation sur des tâches cliniques variées, tout en soulignant les lacunes persistantes dans la prédiction des structures cardiaques et des résultats.

M A Al-Masud, Juan Miguel Lopez Alcaraz, Nils Strodthoff2026-03-05🤖 cs.LG

Learning in an Echo Chamber: Online Learning with Replay Adversary

Cet article introduit un cadre théorique pour l'apprentissage en ligne face à un adversaire de relecture, démontrant que la dimension de seuil étendue caractérise exactement la possibilité d'apprentissage et prouvant que ce scénario est strictement plus difficile que l'apprentissage classique, en particulier pour l'apprentissage propre.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

← Précédent Suivant →

cs.LG