cs.LG articles | Gist.Science

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

Le papier présente SafeDPO, une méthode simple et théoriquement fondée pour l'alignement de sécurité des grands modèles de langage qui optimise directement les préférences sans récompense ni coût, permettant d'améliorer significativement la sécurité tout en préservant l'utilité.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Ce papier présente TADA, un cadre d'augmentation ciblée par modèles de diffusion qui améliore la généralisation des classificateurs d'images en synthétisant uniquement les exemples difficiles à apprendre, surpassant ainsi les méthodes d'augmentation massive tout en réduisant les coûts computationnels.

Dang Nguyen, Jiping Li, Jinghao Zheng + 1 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Cet article propose un filtre supervisé efficace basé sur le score de concordance de queue supérieure (lambda U) d'une copule de Gumbel pour la sélection de caractéristiques dans la prédiction du risque de diabète, démontrant sa capacité à identifier des prédicteurs cliniquement pertinents et à réduire la dimensionnalité des données tout en maintenant des performances compétitives par rapport aux méthodes standards sur des ensembles de données publics et cliniques.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Cet article propose la « Supervised Calibration », un cadre unificateur basé sur la minimisation de la perte qui améliore l'apprentissage en contexte des grands modèles de langage en apprenant des transformations affines optimales pour corriger les biais et réorienter les frontières de décision, surpassant ainsi les méthodes de calibration existantes sur plusieurs modèles et jeux de données.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

An Approximation Theory Perspective on Machine Learning

Cet article examine le décalage entre la théorie de l'approximation et la pratique du machine learning, critique les lacunes actuelles en matière de généralisation, et présente une nouvelle recherche permettant l'approximation de fonctions sur des variétés inconnues sans nécessiter l'apprentissage de caractéristiques spécifiques de la variété.

Hrushikesh N. Mhaskar, Efstratios Tsoukanis, Ameya D. Jagtap2026-03-05🤖 cs.LG

Structural Vibration Monitoring with Diffractive Optical Processors

Cet article présente un système de surveillance des vibrations structurelles à faible consommation et peu coûteux, intégrant une couche diffractive optimisée conjointement avec un réseau de neurones peu profond pour reconstruire en temps réel les spectres de vibrations 3D des infrastructures sans nécessiter de réseaux de capteurs denses.

Yuntian Wang, Zafer Yilmaz, Yuhang Li + 5 more2026-03-05🔬 physics.optics

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

L'article présente AutoQD, une méthode théoriquement fondée qui génère automatiquement des descripteurs comportementaux en utilisant des caractéristiques de Fourier aléatoires pour approximer les mesures d'occupation des politiques, permettant ainsi de découvrir une diversité de comportements performants en apprentissage par renforcement sans recourir à des descripteurs prédéfinis.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

Le papier présente C-EDL, une méthode légère et post-hoc d'apprentissage profond fondé sur l'évidence qui améliore la robustesse aux attaques adverses et aux données hors distribution en ajustant les prédictions grâce à une analyse des conflits générés par des transformations d'entrée, sans nécessiter de réentraînement du modèle.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Cet article démontre que l'estimation honnête dans les forêts causales, bien qu'utile pour éviter le surajustement, peut nuire à la précision des effets de traitement individuels en favorisant le sous-ajustement, et recommande donc d'adapter son utilisation aux objectifs spécifiques plutôt que de l'appliquer systématiquement.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Les auteurs proposent une nouvelle approche bayésienne qui généralise l'ADMM fédéré en exploitant une structure de dualité des objectifs variationnels, permettant de retrouver les mises à jour classiques et d'obtenir des variantes novatrices (de type Newton ou Adam) offrant des gains de performance significatifs.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

On the Limits of Sparse Autoencoders: A Theoretical Framework and Reweighted Remedy

Cet article propose un cadre théorique démontrant les limites des autoencodeurs parcimonieux (SAE) à récupérer les véritables caractéristiques monosémantiques et introduit une méthode de rééquilibrage (WSAE) qui améliore significativement l'interprétabilité de ces modèles.

Jingyi Cui, Qi Zhang, Yifei Wang + 1 more2026-03-05🤖 cs.LG

Context Biasing for Pronunciation-Orthography Mismatch in Automatic Speech Recognition

Cet article propose une méthode de biaisage contextuel permettant d'améliorer la reconnaissance des mots présentant un décalage entre leur prononciation et leur orthographe en exploitant des corrections de substitutions fournies par l'utilisateur en temps réel, ce qui réduit significativement le taux d'erreur sur ces mots spécifiques sans dégrader les performances globales.

Christian Huber, Alexander Waibel2026-03-05🤖 cs.LG

UMA: A Family of Universal Models for Atoms

Meta FAIR présente UMA, une famille de modèles universels pour les atomes entraînée sur 500 millions de structures 3D uniques, qui combine une architecture innovante de type « mélange d'experts linéaires » pour offrir une précision et une généralisation exceptionnelles sans nécessiter de fine-tuning, tout en rendant ses codes, poids et données publics pour accélérer la recherche en chimie et science des matériaux.

Brandon M. Wood, Misko Dzamba, Xiang Fu + 15 more2026-03-05🤖 cs.LG

UQLM: A Python Package for Uncertainty Quantification in Large Language Models

Ce papier présente UQLM, une bibliothèque Python qui utilise des techniques de quantification de l'incertitude pour détecter les hallucinations des grands modèles de langage et améliorer la fiabilité de leurs réponses.

Dylan Bouchard, Mohit Singh Chauhan, David Skarbrevik + 3 more2026-03-05🤖 cs.AI

Q-Guided Stein Variational Model Predictive Control via RL-informed Policy Prior

Ce papier présente Q-SVMPC, une méthode de contrôle prédictif de modèle guidée par les valeurs Q et utilisant des inférences variationnelles de Stein avec un prior de politique issu de l'apprentissage par renforcement, qui améliore l'efficacité, la stabilité et la robustesse en maintenant une diversité de solutions pour des tâches de navigation et de manipulation robotique.

Shizhe Cai, Zeya Yin, Jayadeep Jacob + 1 more2026-03-05🤖 cs.AI

Fast Equivariant Imaging: Acceleration for Unsupervised Learning via Augmented Lagrangian and Auxiliary PnP Denoisers

Cet article propose Fast Equivariant Imaging (FEI), un cadre d'apprentissage non supervisé qui accélère considérablement l'entraînement des réseaux d'imagerie sans données de référence en reformulant le problème via la méthode du lagrangien augmenté et des débruiteurs plug-and-play, offrant ainsi une accélération de 10 fois et de meilleures performances de généralisation par rapport aux méthodes existantes.

Guixian Xu, Jinglai Li, Junqi Tang2026-03-05🤖 cs.LG

Knowing When to Quit: Probabilistic Early Exits for Speech Separation

Cet article présente une architecture de réseau neuronal pour la séparation et l'amélioration de la parole dotée d'une sortie précoce probabiliste et incertaine, permettant d'économiser des ressources de calcul sur des appareils embarqués sans compromettre la qualité de reconstruction.

Kenny Falkær Olsen, Mads Østergaard, Karl Ulbæk + 4 more2026-03-05🤖 cs.LG

Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition

Cette étude révèle que les grands modèles de langage généralisent des tâches inédites grâce à un mécanisme de « fonction d'induction » réutilisable et composable, où plusieurs têtes d'attention collaborent en parallèle pour extraire et appliquer des règles abstraites, comme démontré par l'analyse de l'addition décalée.

Qinyuan Ye, Robin Jia, Xiang Ren2026-03-05🤖 cs.AI

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Cet article établit des bornes d'approximation gaussienne pour les distributions finies de réseaux de neurones profonds à poids aléatoires, démontrant une convergence vers la limite gaussienne avec des taux explicites lorsque les largeurs des couches tendent vers l'infini.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Self-Supervised Inductive Logic Programming

Ce papier présente Poker, un nouvel algorithme d'apprentissage logique inductif auto-supervisé capable de générer automatiquement des exemples positifs et négatifs pour apprendre des programmes récursifs sans théorie de fond ni exemples négatifs fournis par un expert, surpassant ainsi le système Louise qui tend à sur-généraliser dans ce contexte.

Stassa Patsantzis2026-03-05🤖 cs.AI

← Précédent Suivant →