cs.LG articles | Gist.Science

SaFeR-ToolKit: Structured Reasoning via Virtual Tool Calling for Multimodal Safety

Le papier présente SaFeR-ToolKit, une approche qui formalise la prise de décision de sécurité des modèles vision-langage en un protocole vérifiable via l'appel d'outils virtuels et un entraînement en trois étapes, améliorant ainsi significativement la sécurité et le raisonnement tout en préservant les capacités générales.

Zixuan Xu, Tiancheng He, Huahui Yi + 7 more2026-03-04🤖 cs.LG

The Vienna 4G/5G Drive-Test Dataset

Cet article présente le jeu de données de tests de conduite de Vienne, une ressource open source à l'échelle urbaine combinant des mesures passives et actives de réseaux 4G et 5G avec des modèles géographiques détaillés pour faciliter l'apprentissage automatique, la modélisation de propagation et l'optimisation des réseaux mobiles.

Wilfried Wiedner, Lukas Eller, Mariam Mussbah + 4 more2026-03-04⚡ eess

Convex and Non-convex Federated Learning with Stale Stochastic Gradients: Diminishing Step Size is All You Need

Cet article propose un cadre général pour l'apprentissage fédéré avec des gradients stochastiques retardés, démontrant qu'une taille de pas décroissante prédéfinie suffit à atteindre les taux de convergence optimaux pour les objectifs convexes et non convexes, sans nécessiter de tailles de pas adaptatives.

Xinran Zheng, Tara Javidi, Behrouz Touri2026-03-04🤖 cs.LG

HomeAdam: Adam and AdamW Algorithms Sometimes Go Home to Obtain Better Provable Generalization

Ce papier propose et analyse théoriquement la famille d'algorithmes HomeAdam(W), qui améliore la généralisation et la convergence des méthodes Adam et AdamW en alternant avec des étapes de descente de gradient stochastique momentum, prouvant ainsi une erreur de généralisation de l'ordre de $O(1/N)$ supérieure à celle des variantes existantes.

Feihu Huang, Guanyi Zhang, Songcan Chen2026-03-04📊 stat

Improving Diffusion Planners by Self-Supervised Action Gating with Energies

Ce papier propose SAGE, une méthode d'inférence qui améliore la robustesse des planificateurs de diffusion en rééchantillonnant les actions grâce à un signal de cohérence dynamique appris via une architecture JEPA, sans nécessiter de réentraînement ni de rollouts environnementaux.

Yuan Lu, Dongqi Han, Yansen Wang + 1 more2026-03-04🤖 cs.AI

DREAM: Where Visual Understanding Meets Text-to-Image Generation

Le papier présente DREAM, un cadre unifié qui combine l'apprentissage de représentations visuelles et la génération d'images à partir de texte grâce à des techniques innovantes comme le réchauffement du masquage et le décodage aligné sémantiquement, permettant d'obtenir des performances supérieures à la fois en compréhension visuelle et en génération sans nécessiter de réordonnanceurs externes.

Chao Li, Tianhong Li, Sai Vidyaranya Nuthalapati + 8 more2026-03-04🤖 cs.LG

SorryDB: Can AI Provers Complete Real-World Lean Theorems?

Cette présentation de SorryDB, une nouvelle base de référence dynamique pour les tâches Lean issues de projets réels, révèle que les approches actuelles de preuve assistée par IA sont complémentaires et que les modèles d'agents les plus performants ne surpassent pas systématiquement les autres méthodes existantes.

Austin Letson, Leopoldo Sarra, Auguste Poiroux + 9 more2026-03-04🤖 cs.AI

Exact Functional ANOVA Decomposition for Categorical Inputs Models

Cet article propose une décomposition fonctionnelle ANOVA exacte et efficace en forme fermée pour les modèles à entrées catégorielles, valable pour toute distribution de dépendance et permettant une généralisation naturelle des valeurs SHAP.

Baptiste Ferrere, Nicolas Bousquet, Fabrice Gamboa + 2 more2026-03-04📊 stat

From Shallow to Deep: Pinning Semantic Intent via Causal GRPO

Cet article propose TSC-GRPO, un cadre d'apprentissage par renforcement causal qui résout la vulnérabilité des grands modèles de langage aux attaques par préfixe en ancrant l'intention malveillante via un détecteur causal et une optimisation de politique, permettant ainsi des refus robustes tout en préservant l'utilité générale.

Shuyi Zhou, Zeen Song, Wenwen Qiang + 4 more2026-03-04🤖 cs.LG

Addressing Missing and Noisy Modalities in One Solution: Unified Modality-Quality Framework for Low-quality Multimodal Data

Ce papier propose le cadre unifié UMQ, qui traite conjointement les modalités manquantes et bruyantes comme un problème unique de qualité pour améliorer la robustesse des modèles d'affectivité multimodale grâce à un estimateur de qualité, un amplificateur et un module d'experts mélangés.

Sijie Mai, Shiqin Han, Haifeng Hu2026-03-04🤖 cs.LG

An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification

Cette étude démontre que la prédiction sélective basée sur l'incertitude échoue souvent dans la classification clinique multimodale en raison d'une mauvaise calibration spécifique aux classes, masquée par les métriques d'évaluation standards et nécessitant une approche d'évaluation consciente de la calibration pour garantir la sécurité des systèmes d'IA.

L. Julián Lechuga López, Farah E. Shamout, Tim G. J. Rudner2026-03-04🤖 cs.LG

Single Microphone Own Voice Detection based on Simulated Transfer Functions for Hearing Aids

Cet article présente une méthode de détection de la voix propre pour les appareils auditifs utilisant un seul microphone, qui combine des fonctions de transfert acoustiques simulées et un classificateur basé sur des transformers pour atteindre une grande précision et une bonne généralisation aux conditions réelles.

Mathuranathan Mayuravaani, W. Bastiaan Kleijn, Andrew Lensen + 1 more2026-03-04🤖 cs.LG

The power of small initialization in noisy low-tubal-rank tensor recovery

Cet article démontre que l'utilisation d'une petite initialisation dans la descente de gradient factorisée permet de récupérer avec une précision quasi optimale un tenseur de faible rang-tubal à partir de mesures bruitées, même en cas de sur-paramétrage significatif, en éliminant la dépendance de l'erreur de reconstruction vis-à-vis du rang surestimé.

ZHiyu Liu, Haobo Geng, Xudong Wang + 3 more2026-03-04📊 stat

Practical FP4 Training for Large-Scale MoE Models on Hopper GPUs

Cet article présente une méthode de formation pratique pour les modèles MoE à grande échelle sur les GPU Hopper qui, grâce à une quantisation directe FP8-FP4 et une conversion adaptative, permet d'utiliser l'efficacité de la précision FP4 pour les activations et la communication sans support matériel natif, réduisant ainsi la mémoire de pic de 14,8 % et augmentant le débit de 12,5 % par rapport aux bases FP8.

Wuyue Zhang, Chongdong Huang, Chunbo You + 3 more2026-03-04🤖 cs.AI

Enhancing User Throughput in Multi-panel mmWave Radio Access Networks for Beam-based MU-MIMO Using a DRL Method

Cet article propose une approche d'apprentissage par renforcement profond pour optimiser la sélection de faisceaux dans les réseaux d'accès radio mmWave multi-panneaux, permettant d'augmenter le débit utilisateur de 16 % et de réduire la latence de 3 à 7 fois par rapport aux méthodes traditionnelles.

Ramin Hashemi, Vismika Ranasinghe, Teemu Veijalainen + 2 more2026-03-04🤖 cs.AI

Deep learning-guided evolutionary optimization for protein design

Cet article présente BoGA, un cadre d'optimisation combinant algorithmes génétiques et optimisation bayésienne pour accélérer la conception efficace de protéines, démontré notamment par la découverte de peptides inhibant la pneumolysine.

Erik Hartman, Di Tang, Johan Malmström2026-03-04🧬 q-bio

Rethinking Time Series Domain Generalization via Structure-Stratified Calibration

Cet article propose un cadre de calibration stratifiée par structure (SSCF) qui améliore la généralisation de domaine des séries temporelles en distinguant les échantillons structurellement cohérents pour effectuer un alignement localisé, évitant ainsi les transferts négatifs causés par l'hétérogénéité des systèmes dynamiques sous-jacents.

Jinyang Li, Shuhao Mei, Xiaoyu Xiao + 3 more2026-03-04🤖 cs.LG

Next Embedding Prediction Makes World Models Stronger

Le papier présente NE-Dreamer, un agent d'apprentissage par renforcement sans décodeur qui utilise un transformateur temporel pour prédire les prochaines embeddings et ainsi apprendre des représentations d'état cohérentes, surpassant ou égalant les performances des méthodes de pointe sur des tâches complexes partiellement observables.

George Bredis, Nikita Balagansky, Daniil Gavrilov + 1 more2026-03-04🤖 cs.AI

From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

Ce papier présente KMP-Bench, une nouvelle évaluation complète pour les modèles de langage en mathématiques (K-8) qui révèle un décalage entre leurs capacités de résolution et leurs compétences pédagogiques, tout en démontrant l'efficacité d'un jeu de données d'entraînement enrichi, KMP-Pile, pour améliorer leurs performances en tant que tuteurs.

Weikang Shi, Houxing Ren, Junting Pan + 8 more2026-03-04💬 cs.CL

Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies

Cet article présente un cadre d'apprentissage par imitation génératif adversaire permettant à des essaims de robots d'acquérir des comportements collectifs à partir de démonstrations humaines ou de politiques entraînées, avec une validation réussie en simulation et sur des robots TurtleBot 4 réels.

Mattes Kraus, Jonas Kuckling2026-03-04🤖 cs.LG

← Précédent Suivant →