cs.LG articles | Gist.Science

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Cette étude démontre que les modèles audio auto-supervisés performants dans des tâches de perception auditive développent des représentations internes plus proches de l'activité cérébrale humaine, suggérant que cette similarité biologique émerge naturellement de l'apprentissage de la reconstruction de données audio.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model

EnECG est un cadre d'apprentissage ensembliste efficace qui combine plusieurs modèles fondation spécialisés via un mécanisme de mélange d'experts et une adaptation légère (LoRA) pour améliorer l'analyse multi-tâches des électrocardiogrammes tout en réduisant les coûts computationnels.

Yuhao Xu, Xiaoda Wang, Jiaying Lu + 6 more2026-03-05🤖 cs.AI

Soft Quality-Diversity Optimization

Cet article propose une nouvelle approche de l'optimisation qualité-diversité appelée « Soft QD » qui élimine le besoin de discrétisation de l'espace des comportements, permettant ainsi de développer l'algorithme différentiable SQUAD, plus évolutif et performant sur les problèmes à haute dimensionnalité.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.LG

Weight Space Representation Learning via Neural Field Adaptation

Cette étude démontre que l'adaptation LoRA multiplicative appliquée aux champs neuronaux permet d'obtenir des représentations de poids structurées et sémantiquement riches, surpassant les méthodes existantes pour des tâches de reconstruction, de génération et d'analyse en 2D et 3D.

Zhuoqian Yang, Mathieu Salzmann, Sabine Süsstrunk2026-03-05🤖 cs.AI

ceLLMate: Sandboxing Browser AI Agents

Le papier présente ceLLMate, un cadre de sandboxing au niveau du navigateur qui atténue les risques d'injection de prompt dans les agents IA en imposant des politiques de sécurité au niveau HTTP pour combler l'écart sémantique entre les interactions UI et les communications réseau, tout en limitant la latence à moins de 15 %.

Luoxi Meng, Henry Feng, Ilia Shumailov + 1 more2026-03-05🤖 cs.LG

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

Le papier propose NRR-Core, un cadre de raisonnement non résolutif qui préserve l'ambiguïté et l'identité contextuelle en remplaçant l'effondrement sémantique prématuré des systèmes d'IA actuels par la coexistence d'interprétations multiples via des principes de non-identité et d'identité approximative.

Kei Saito2026-03-05🤖 cs.AI

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Cet article introduit un budget de dérive intrinsèque mesuré par la distance de Fisher-Rao pour caractériser l'apprentissage sous dérive distributionnelle dans des boucles fermées, établissant des bornes de reproductibilité préquentielle qui démontrent que la précision à court terme est fondamentalement limitée par le taux moyen de dérive.

Sofiya Zaichyk2026-03-05🤖 cs.LG

BumpNet: A Sparse MLP Framework for Learning PDE Solutions

Ce papier présente BumpNet, un cadre d'apprentissage profond basé sur des MLP clairsemés utilisant des fonctions de base dérivées de sigmoïdes pour résoudre efficacement des équations aux dérivées partielles et apprendre des opérateurs, tout en garantissant des propriétés d'approximation universelle.

Shao-Ting Chiu, Ioannis G. Kevrekidis, Ulisses Braga-Neto2026-03-05🤖 cs.LG

Online Robust Reinforcement Learning with General Function Approximation

Cet article propose un algorithme d'apprentissage par renforcement robuste entièrement en ligne avec approximation fonctionnelle générale, qui apprend des politiques résilientes uniquement par interaction et établit des garanties de regret sublinéaires basées sur la dimension d'Eluder de Bellman robuste.

Debamita Ghosh, George K. Atia, Yue Wang2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Ce papier présente OASI, une méthode d'initialisation de surrogate consciente des objectifs qui améliore l'optimisation bayésienne multi-objectif pour le repérage de mots-clés sur microcontrôleurs en générant des solutions initiales biaisées vers le compromis précision-mémoire, garantissant ainsi des modèles déployables sans violer les contraintes de ressources.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Generalization of RLVR Using Causal Reasoning as a Testbed

Cette étude démontre que l'apprentissage par renforcement avec récompenses vérifiables (RLVR) améliore la généralisation des modèles de langage aux tâches de raisonnement causal, à condition que le modèle possède une compétence initiale suffisante et que la taille du modèle et le niveau de difficulté des requêtes d'entraînement soient adaptés.

Brian Lu, Hongyu Zhao, Shuo Sun + 3 more2026-03-05🤖 cs.AI

Deterministic Coreset for Lp Subspace

Cet article présente le premier algorithme itératif déterministe pour construire un coreset de taille optimale sans facteurs logarithmiques, garantissant une intégration de sous-espace $\ell_p$ pour tout $p \in [1,\infty)$ et permettant ainsi de résoudre de manière déterministe le problème de régression $\ell_p$ .

Rachit Chhaya, Anirban Dasgupta, Dan Feldman + 1 more2026-03-05🤖 cs.LG

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Ce papier présente DevRev-Search, un benchmark de recherche technique construit automatiquement, et propose une stratégie d'adaptation préservant l'index qui affine uniquement l'encodeur de requête pour améliorer la pertinence dans les systèmes multi-locataires sans nécessiter de réindexation coûteuse.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Cet article propose le Correcteur de Langevin Consistant aux Mesures (MCLC), un module de stabilisation théorique qui corrige les instabilités des solveurs de problèmes inverses basés sur les modèles de diffusion latente en alignant leurs dynamiques avec celles apprises par le modèle via des mises à jour consistantes aux mesures.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Cette étude propose une approche automatisée en plusieurs étapes pour détecter les fractures de la colonne cervicale en reconstruisant des volumes 3D estimés à partir de segmentations 2D orthogonales fusionnées, permettant ainsi d'obtenir des performances diagnostiques comparables à celles des radiologues experts tout en réduisant la complexité dimensionnelle du traitement.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Cet article propose un cadre statistique unifié démontrant que l'augmentation synthétique dans l'apprentissage déséquilibré n'est pas toujours bénéfique et que sa taille optimale dépend de l'alignement des erreurs du générateur, conduisant à recommander une méthode de sélection par validation (VTSS) plutôt qu'un équilibrage complet naïf.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

SpecBridge: Bridging Mass Spectrometry and Molecular Representations via Cross-Modal Alignment

Le papier présente SpecBridge, un cadre d'alignement croisé innovant qui améliore considérablement l'identification des petites molécules à partir de spectres de masse en affinant un encodeur spectral pour projeter directement dans l'espace latent d'un modèle fondamental moléculaire figé, surpassant ainsi les méthodes de base existantes avec une efficacité paramétrique accrue.

Yinkai Wang, Yan Zhou Chen, Xiaohui Chen + 2 more2026-03-05🤖 cs.LG

LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Ce papier présente LeanTutor, un système de tutorat de preuves mathématiques combinant les forces des grands modèles de langage et des prouveurs de théorèmes pour offrir un feedback vérifié, évalué grâce à un nouveau jeu de données nommé PeanoBench.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu + 4 more2026-03-05🤖 cs.LG

NRR-Phi: Text-to-State Mapping for Ambiguity Preservation in LLM Inference

Le papier présente NRR-Phi, un cadre formel de mappage texte-état qui transforme le langage naturel en un espace d'états non-collapsant préservant les multiples interprétations ambiguës grâce à une pipeline hybride de détection de conflits et d'extraction, comblant ainsi le lien algorithmique manquant entre le texte et l'espace d'états du Raisonnement Non-Résolutif (NRR) pour retarder l'effondrement sémantique prématuré des grands modèles de langage.

Kei Saito2026-03-05🤖 cs.AI

No More, No Less: Least-Privilege Language Models

Ce papier propose un nouveau paradigme de déploiement pour les modèles de langage, baptisé « Nested Least-Privilege Networks », qui permet de restreindre dynamiquement et réversiblement les capacités computationnelles internes du modèle lors de l'inférence afin d'appliquer le principe du moindre privilège sans nécessiter de réentraînement.

Paulius Rauba, Dominykas Seputis, Patrikas Vanagas + 1 more2026-03-05🤖 cs.LG

← Précédent Suivant →