Koopman Regularized Deep Speech Disentanglement for Speaker Verification

Cet article propose le DKSD-AE, un autoencodeur structuré combinant un opérateur de Koopman et une normalisation d'instance pour apprendre des représentations de locuteur décorrélées du contenu linguistique sans supervision textuelle, tout en surpassant ou égalant les performances des méthodes de l'état de l'art avec moins de paramètres.

Nikos Chazaridis, Mohammad Belal, Rafael Mestre, Timothy J. Norman, Christine Evers2026-03-09🤖 cs.LG

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Cette étude propose un cadre d'analyse GeoAI hybride combinant MGWR, Random Forest et ST-GCN pour modéliser avec une grande précision les interactions spatio-temporelles hétérogènes entre l'usage des sols et les flux de trafic multimodaux, offrant ainsi aux urbanistes un outil interprétable pour la gestion de la mobilité et la conception de politiques foncières.

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

On the Value of Tokeniser Pretraining in Physics Foundation Models

Cette étude démontre que le pré-entraînement d'un tokeniser via un objectif d'auto-encodage améliore significativement l'efficacité et la précision des modèles de fondation en physique, en particulier lorsque le pré-entraînement est réalisé sur le même système physique que la tâche finale.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

L'article présente behavior-dLDS, un modèle de systèmes dynamiques linéaires décomposés qui permet de dissocier les sous-systèmes neuronaux liés au comportement de ceux dédiés aux calculs internes, démontrant ainsi son efficacité sur des données simulées et des enregistrements à grande échelle chez le poisson-zèbre.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. Charles2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Ce papier propose l'interpolated FID (iFID), une nouvelle métrique dérivée du rFID qui, en interpolant les représentations latentes avec leurs plus proches voisins, établit pour la première fois une forte corrélation avec le FID de génération des modèles de diffusion, contrairement au rFID classique.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Cet article propose l'« Implicit Error Counting » (IEC), une méthode d'apprentissage par renforcement sans référence qui remplace les rubriques d'évaluation par un comptage d'erreurs pondérées, démontrant ainsi son efficacité supérieure à l'approche « Rubrics as Rewards » pour le réessayage virtuel de vêtements où plusieurs réponses valides existent.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Cet article démontre que l'apprentissage d'un modèle fort à partir des labels imparfaits d'un modèle faible via la régression ridge à caractéristiques aléatoires permet d'améliorer substantiellement les lois d'échelle de l'erreur de test, permettant au modèle fort d'atteindre des taux optimaux même lorsque le modèle faible ne voit pas son erreur diminuer avec la taille de l'échantillon.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Cette étude examine les stratégies de parallélisation pour le déploiement de modèles de langage denses, démontrant que la parallélisation tensorielle optimise la latence tandis que la parallélisation pipeline favorise le débit, permettant ainsi de maîtriser le compromis entre les deux via une configuration hybride.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Cet article établit un cadre géométrique basé sur les fibrés principaux pour analyser les limitations fondamentales et les opportunités de l'apprentissage des équations différentielles régissant l'évolution des réseaux temporels modélisés par des graphes à produit scalaire aléatoire, en démontrant que la structure dynamique peut résoudre l'ambiguïté de jauge tout en révélant un lien inextricable entre la difficulté géométrique et statistique.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

Bien que l'intelligence artificielle promette d'accélérer la production d'informations climatiques, ce papier met en garde contre le risque qu'elle exacerbe les inégalités mondiales en raison d'une infrastructure inégale et de biais de données, et propose une transition vers des modèles centrés sur les données, des infrastructures numériques publiques et une co-production des connaissances pour garantir une résilience équitable.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Cette étude démontre que l'adaptation de domaine non supervisée, en particulier via la minimisation de la divergence maximale de moments (MMD), permet d'améliorer significativement la capacité d'un modèle d'identification de radioisotopes, entraîné sur des données synthétiques, à se généraliser à des environnements expérimentaux réels en utilisant des données cibles non étiquetées.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG