cs.LG articles | Gist.Science

Koopman Regularized Deep Speech Disentanglement for Speaker Verification

Cet article propose le DKSD-AE, un autoencodeur structuré combinant un opérateur de Koopman et une normalisation d'instance pour apprendre des représentations de locuteur décorrélées du contenu linguistique sans supervision textuelle, tout en surpassant ou égalant les performances des méthodes de l'état de l'art avec moins de paramètres.

Nikos Chazaridis, Mohammad Belal, Rafael Mestre, Timothy J. Norman, Christine Evers2026-03-09🤖 cs.LG

A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

Cet article présente une nouvelle approche hybride combinant des heuristiques spécifiques au domaine ferroviaire et l'apprentissage par renforcement (Q-learning) pour optimiser efficacement le triage des wagons dans des gares de fret, que ce soit avec un accès unilatéral ou bilatéral.

Ruonan Zhao, Joseph Geunes2026-03-09🤖 cs.LG

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Cette étude propose un cadre d'analyse GeoAI hybride combinant MGWR, Random Forest et ST-GCN pour modéliser avec une grande précision les interactions spatio-temporelles hétérogènes entre l'usage des sols et les flux de trafic multimodaux, offrant ainsi aux urbanistes un outil interprétable pour la gestion de la mobilité et la conception de politiques foncières.

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models

Ce papier présente la méthode BISE, qui permet d'extraire des sous-réseaux exempts de biais à partir de modèles pré-entraînés standards par simple élagage, sans nécessiter de réentraînement ni de données supplémentaires.

Ivan Luiz De Moura Matos, Abdel Djalil Sad Saoud, Ekaterina Iakovleva, Vito Paolo Pastore, Enzo Tartaglione2026-03-09🤖 cs.LG

On the Value of Tokeniser Pretraining in Physics Foundation Models

Cette étude démontre que le pré-entraînement d'un tokeniser via un objectif d'auto-encodage améliore significativement l'efficacité et la précision des modèles de fondation en physique, en particulier lorsque le pré-entraînement est réalisé sur le même système physique que la tâche finale.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Cet article propose le premier cadre de vérification robuste couplée pour les détecteurs de points clés basés sur des cartes de chaleur, qui garantit la robustesse en bornant les déviations conjointes de tous les points clés via un problème de falsification résolu par programmation linéaire en nombres entiers mixtes (MILP).

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

L'article présente behavior-dLDS, un modèle de systèmes dynamiques linéaires décomposés qui permet de dissocier les sous-systèmes neuronaux liés au comportement de ceux dédiés aux calculs internes, démontrant ainsi son efficacité sur des données simulées et des enregistrements à grande échelle chez le poisson-zèbre.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. Charles2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

Le papier présente RACAS, une architecture agentic basée sur des modèles de langage qui permet de contrôler de manière unifiée et sans réentraînement divers robots (terrestres, sous-marins et articulés) en se fiant uniquement à des descriptions et commandes en langage naturel.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

Identifying Adversary Characteristics from an Observed Attack

Cet article propose un cadre novateur permettant d'identifier les caractéristiques probables d'un attaquant à partir d'une attaque observée sur des modèles d'apprentissage automatique, afin de renforcer les défenses par des mesures exogènes ou par l'optimisation des algorithmes d'apprentissage.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Ce papier propose l'interpolated FID (iFID), une nouvelle métrique dérivée du rFID qui, en interpolant les représentations latentes avec leurs plus proches voisins, établit pour la première fois une forte corrélation avec le FID de génération des modèles de diffusion, contrairement au rFID classique.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Cet article propose l'« Implicit Error Counting » (IEC), une méthode d'apprentissage par renforcement sans référence qui remplace les rubriques d'évaluation par un comptage d'erreurs pondérées, démontrant ainsi son efficacité supérieure à l'approche « Rubrics as Rewards » pour le réessayage virtuel de vêtements où plusieurs réponses valides existent.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

The Value of Graph-based Encoding in NBA Salary Prediction

Cet article démontre que l'intégration d'encodages graphiques dérivés de données sur et hors terrain dans des modèles d'apprentissage supervisé améliore significativement la prédiction des salaires des joueurs de la NBA, en particulier pour les vétérans et les cas extrêmes où les approches tabulaires classiques échouent.

Junhao Su, David Grimsman, Christopher Archibald2026-03-09🤖 cs.LG

Reinforcement Learning for Power-Flow Network Analysis

Cet article propose l'utilisation de l'apprentissage par renforcement pour concevoir des réseaux électriques présentant un nombre d'équilibres de flux de puissance supérieur à la moyenne, surpassant ainsi les méthodes algébriques computationnelles actuelles pour les réseaux complexes.

Alperen Ergur, Julia Lindberg, Vinny Miller2026-03-09🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Cet article démontre que l'apprentissage d'un modèle fort à partir des labels imparfaits d'un modèle faible via la régression ridge à caractéristiques aléatoires permet d'améliorer substantiellement les lois d'échelle de l'erreur de test, permettant au modèle fort d'atteindre des taux optimaux même lorsque le modèle faible ne voit pas son erreur diminuer avec la taille de l'échantillon.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Cette étude examine les stratégies de parallélisation pour le déploiement de modèles de langage denses, démontrant que la parallélisation tensorielle optimise la latence tandis que la parallélisation pipeline favorise le débit, permettant ainsi de maîtriser le compromis entre les deux via une configuration hybride.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Warm Starting State-Space Models with Automata Learning

Ce papier établit une correspondance formelle entre les machines de Moore et les modèles d'espace d'état (SSM), démontrant que l'initialisation des SSMs par des automates appris symboliquement permet d'accélérer la convergence et d'améliorer la précision par rapport à une initialisation aléatoire.

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Cet article établit un cadre géométrique basé sur les fibrés principaux pour analyser les limitations fondamentales et les opportunités de l'apprentissage des équations différentielles régissant l'évolution des réseaux temporels modélisés par des graphes à produit scalaire aléatoire, en démontrant que la structure dynamique peut résoudre l'ambiguïté de jauge tout en révélant un lien inextricable entre la difficulté géométrique et statistique.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

Bien que l'intelligence artificielle promette d'accélérer la production d'informations climatiques, ce papier met en garde contre le risque qu'elle exacerbe les inégalités mondiales en raison d'une infrastructure inégale et de biais de données, et propose une transition vers des modèles centrés sur les données, des infrastructures numériques publiques et une co-production des connaissances pour garantir une résilience équitable.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Cette étude démontre que l'adaptation de domaine non supervisée, en particulier via la minimisation de la divergence maximale de moments (MMD), permet d'améliorer significativement la capacité d'un modèle d'identification de radioisotopes, entraîné sur des données synthétiques, à se généraliser à des environnements expérimentaux réels en utilisant des données cibles non étiquetées.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

En réexaminant l'alignement au moment de l'inférence sous l'angle du taux de victoire plutôt que de la récompense attendue, cette étude démontre que l'échantillonnage Best-of-N est statistiquement optimal et propose une variante simple qui élimine le piratage de la récompense tout en conservant cette optimalité.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

← Précédent Suivant →