cs.LG articles | Gist.Science

DREAM: Where Visual Understanding Meets Text-to-Image Generation

Le papier présente DREAM, un cadre unifié qui combine l'apprentissage de représentations visuelles et la génération d'images à partir de texte grâce à des techniques innovantes comme le réchauffement du masquage et le décodage aligné sémantiquement, permettant d'obtenir des performances supérieures à la fois en compréhension visuelle et en génération sans nécessiter de réordonnanceurs externes.

Chao Li, Tianhong Li, Sai Vidyaranya Nuthalapati + 8 more2026-03-04🤖 cs.LG

SorryDB: Can AI Provers Complete Real-World Lean Theorems?

Cette présentation de SorryDB, une nouvelle base de référence dynamique pour les tâches Lean issues de projets réels, révèle que les approches actuelles de preuve assistée par IA sont complémentaires et que les modèles d'agents les plus performants ne surpassent pas systématiquement les autres méthodes existantes.

Austin Letson, Leopoldo Sarra, Auguste Poiroux + 9 more2026-03-04🤖 cs.AI

Exact Functional ANOVA Decomposition for Categorical Inputs Models

Cet article propose une décomposition fonctionnelle ANOVA exacte et efficace en forme fermée pour les modèles à entrées catégorielles, valable pour toute distribution de dépendance et permettant une généralisation naturelle des valeurs SHAP.

Baptiste Ferrere, Nicolas Bousquet, Fabrice Gamboa + 2 more2026-03-04📊 stat

From Shallow to Deep: Pinning Semantic Intent via Causal GRPO

Cet article propose TSC-GRPO, un cadre d'apprentissage par renforcement causal qui résout la vulnérabilité des grands modèles de langage aux attaques par préfixe en ancrant l'intention malveillante via un détecteur causal et une optimisation de politique, permettant ainsi des refus robustes tout en préservant l'utilité générale.

Shuyi Zhou, Zeen Song, Wenwen Qiang + 4 more2026-03-04🤖 cs.LG

Addressing Missing and Noisy Modalities in One Solution: Unified Modality-Quality Framework for Low-quality Multimodal Data

Ce papier propose le cadre unifié UMQ, qui traite conjointement les modalités manquantes et bruyantes comme un problème unique de qualité pour améliorer la robustesse des modèles d'affectivité multimodale grâce à un estimateur de qualité, un amplificateur et un module d'experts mélangés.

Sijie Mai, Shiqin Han, Haifeng Hu2026-03-04🤖 cs.LG

An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification

Cette étude démontre que la prédiction sélective basée sur l'incertitude échoue souvent dans la classification clinique multimodale en raison d'une mauvaise calibration spécifique aux classes, masquée par les métriques d'évaluation standards et nécessitant une approche d'évaluation consciente de la calibration pour garantir la sécurité des systèmes d'IA.

L. Julián Lechuga López, Farah E. Shamout, Tim G. J. Rudner2026-03-04🤖 cs.LG

Single Microphone Own Voice Detection based on Simulated Transfer Functions for Hearing Aids

Cet article présente une méthode de détection de la voix propre pour les appareils auditifs utilisant un seul microphone, qui combine des fonctions de transfert acoustiques simulées et un classificateur basé sur des transformers pour atteindre une grande précision et une bonne généralisation aux conditions réelles.

Mathuranathan Mayuravaani, W. Bastiaan Kleijn, Andrew Lensen + 1 more2026-03-04🤖 cs.LG

The power of small initialization in noisy low-tubal-rank tensor recovery

Cet article démontre que l'utilisation d'une petite initialisation dans la descente de gradient factorisée permet de récupérer avec une précision quasi optimale un tenseur de faible rang-tubal à partir de mesures bruitées, même en cas de sur-paramétrage significatif, en éliminant la dépendance de l'erreur de reconstruction vis-à-vis du rang surestimé.

ZHiyu Liu, Haobo Geng, Xudong Wang + 3 more2026-03-04📊 stat

Practical FP4 Training for Large-Scale MoE Models on Hopper GPUs

Cet article présente une méthode de formation pratique pour les modèles MoE à grande échelle sur les GPU Hopper qui, grâce à une quantisation directe FP8-FP4 et une conversion adaptative, permet d'utiliser l'efficacité de la précision FP4 pour les activations et la communication sans support matériel natif, réduisant ainsi la mémoire de pic de 14,8 % et augmentant le débit de 12,5 % par rapport aux bases FP8.

Wuyue Zhang, Chongdong Huang, Chunbo You + 3 more2026-03-04🤖 cs.AI

Enhancing User Throughput in Multi-panel mmWave Radio Access Networks for Beam-based MU-MIMO Using a DRL Method

Cet article propose une approche d'apprentissage par renforcement profond pour optimiser la sélection de faisceaux dans les réseaux d'accès radio mmWave multi-panneaux, permettant d'augmenter le débit utilisateur de 16 % et de réduire la latence de 3 à 7 fois par rapport aux méthodes traditionnelles.

Ramin Hashemi, Vismika Ranasinghe, Teemu Veijalainen + 2 more2026-03-04🤖 cs.AI

Deep learning-guided evolutionary optimization for protein design

Cet article présente BoGA, un cadre d'optimisation combinant algorithmes génétiques et optimisation bayésienne pour accélérer la conception efficace de protéines, démontré notamment par la découverte de peptides inhibant la pneumolysine.

Erik Hartman, Di Tang, Johan Malmström2026-03-04🧬 q-bio

Rethinking Time Series Domain Generalization via Structure-Stratified Calibration

Cet article propose un cadre de calibration stratifiée par structure (SSCF) qui améliore la généralisation de domaine des séries temporelles en distinguant les échantillons structurellement cohérents pour effectuer un alignement localisé, évitant ainsi les transferts négatifs causés par l'hétérogénéité des systèmes dynamiques sous-jacents.

Jinyang Li, Shuhao Mei, Xiaoyu Xiao + 3 more2026-03-04🤖 cs.LG

Next Embedding Prediction Makes World Models Stronger

Le papier présente NE-Dreamer, un agent d'apprentissage par renforcement sans décodeur qui utilise un transformateur temporel pour prédire les prochaines embeddings et ainsi apprendre des représentations d'état cohérentes, surpassant ou égalant les performances des méthodes de pointe sur des tâches complexes partiellement observables.

George Bredis, Nikita Balagansky, Daniil Gavrilov + 1 more2026-03-04🤖 cs.AI

From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

Ce papier présente KMP-Bench, une nouvelle évaluation complète pour les modèles de langage en mathématiques (K-8) qui révèle un décalage entre leurs capacités de résolution et leurs compétences pédagogiques, tout en démontrant l'efficacité d'un jeu de données d'entraînement enrichi, KMP-Pile, pour améliorer leurs performances en tant que tuteurs.

Weikang Shi, Houxing Ren, Junting Pan + 8 more2026-03-04💬 cs.CL

Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies

Cet article présente un cadre d'apprentissage par imitation génératif adversaire permettant à des essaims de robots d'acquérir des comportements collectifs à partir de démonstrations humaines ou de politiques entraînées, avec une validation réussie en simulation et sur des robots TurtleBot 4 réels.

Mattes Kraus, Jonas Kuckling2026-03-04🤖 cs.LG

From Heuristic Selection to Automated Algorithm Design: LLMs Benefit from Strong Priors

En démontrant que l'intégration d'exemples d'algorithmes de haute qualité issus de benchmarks améliore significativement les performances des modèles de langage pour la conception automatisée d'algorithmes, cette étude propose une approche fondée sur des priors solides qui surpasse les méthodes existantes sur des problèmes d'optimisation en boîte noire.

Qi Huang, Furong Ye, Ananta Shahane + 2 more2026-03-04🤖 cs.LG

Differentiable Time-Varying IIR Filtering for Real-Time Speech Denoising

Cet article présente TVF, un modèle d'amélioration de la parole à faible latence et interprétable qui combine un réseau de neurones léger avec un filtre IIR différentiable à 35 bandes pour s'adapter dynamiquement au bruit non stationnaire en temps réel.

Riccardo Rota, Kiril Ratmanski, Jozef Coldenhoff + 1 more2026-03-04⚡ eess

The Price of Robustness: Stable Classifiers Need Overparameterization

Cet article établit que pour les classifieurs discontinus, une stabilité élevée (robustesse) nécessite une surparamétrisation substantielle, car les modèles interpolants avec un nombre de paramètres proche de celui des données sont intrinsèquement instables.

Jonas von Berg, Adalbert Fono, Massimiliano Datres + 2 more2026-03-04🤖 cs.LG

Lattice-based Deep Neural Networks: Regularity and Tailored Regularization

Cet article de synthèse examine l'application des règles de réseau aux réseaux de neurones profonds, démontrant que l'utilisation de points d'entraînement adaptés et d'une régularisation ciblée permet d'obtenir des bornes d'erreur de généralisation indépendantes de la dimension et des performances numériques supérieures à la régularisation $\ell_2$ standard.

Alexander Keller, Frances Y. Kuo, Dirk Nuyens + 1 more2026-03-04🤖 cs.LG

ChemFlow:A Hierarchical Neural Network for Multiscale Representation Learning in Chemical Mixtures

Le papier présente ChemFlow, un cadre d'apprentissage hiérarchique innovant qui intègre des caractéristiques atomiques, de groupes fonctionnels et moléculaires pour prédire avec une précision supérieure les propriétés physicochimiques des mélanges chimiques complexes en tenant compte de leur composition et de leurs concentrations.

Jinming Fan, Chao Qian, Wilhelm T. S. Huck + 2 more2026-03-04🤖 cs.LG

← Précédent Suivant →