cs.LG articles | Gist.Science

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Cet article établit que les chocs géopolitiques et géoéconomiques affectent le risque souverain par des canaux distincts, les premiers agissant directement sur le risque de défaut tandis que les seconds opèrent via la politique monétaire et le cycle financier mondial, créant ainsi un « motif de ciseaux » dans les spreads de CDS.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

Le papier propose HyWA, une méthode de détection d'activité vocale personnalisée qui utilise un hyper-réseau pour générer des poids adaptés à un locuteur cible, surpassant les techniques existantes en améliorant la précision moyenne et en facilitant le déploiement grâce à une architecture VAD réutilisable.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

Ce papier présente un cadre génératif explicable et conscient des biais qui intègre une fusion d'attention multimodale, l'attribution Grad-CAM++ et une boucle de rétroaction « Révéler pour Réviser », démontrant des performances supérieures et une robustesse accrue sur des benchmarks d'images et de texte pour des applications d'IA à haut risque.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

Cet article propose de nouveaux indices absolus de validité de clusters, basés sur des fonctions de compacité et de séparabilité, pour déterminer le nombre optimal de clusters et évaluer la qualité des regroupements sur des données synthétiques et réelles.

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

Cet article propose un cadre théorique nommé « Hermite eigenstructure ansatz » (HEA) qui permet de prédire les courbes d'apprentissage de la régression à noyau sur des jeux de données réels en se basant uniquement sur la matrice de covariance empirique et une décomposition polynomiale de la fonction cible, en démontrant que les données d'images réelles sont suffisamment « gaussiennes » pour que cette approximation soit valide.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

Cet article présente une analyse unifiée basée sur la géométrie démontrant que, sous l'hypothèse d'une politique optimale unique et unichaine, l'algorithme d'itération de la valeur converge géométriquement et plus rapidement que prévu dans les cas de récompenses escomptées et moyennes.

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

Le papier présente KVTC, une méthode de codage par transformation légère qui compresse les caches KV des grands modèles de langage jusqu'à 20 fois pour optimiser la gestion de la mémoire GPU tout en préservant la précision du raisonnement et du contexte long.

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

Cet article présente les Modèles Causaux Temporels Augmentés (ATSCM), une approche intégrant la découverte causale neuronale pour modéliser les régimes dynamiques des marchés de l'énergie et permettre des raisonnements contrefactuels sur les prix de l'électricité.

Dennis Thumm2026-03-12📊 stat

Towards Causal Market Simulators

Cet article propose le modèle TNCM-VAE, une architecture combinant autoencodeurs variationnels et modèles causaux structurels pour générer des séries temporelles financières contrefactuelles respectant les dépendances causales, permettant ainsi des analyses de risque et des tests de stress plus fiables.

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Cet article propose le cadre DGET, une architecture d'apprentissage multi-tâches combinant des réseaux de neurones graphiques et des transformateurs, pour optimiser l'allocation des ressources dans les réseaux IoT hybrides radio-optiques en maximisant le débit et en réduisant l'âge de l'information tout en gérant les contraintes énergétiques et l'observabilité partielle des canaux.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

Ce papier présente STREAM-VAE, un modèle d'autoencodeur variationnel à double voie qui améliore la détection d'anomalies dans les données de télémétrie automobile en séparant explicitement les dérives lentes et les pics rapides pour éviter le lissage des signaux critiques.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Cet article présente un cadre d'oubli sélectif hiérarchique à double stratégie qui, en combinant des mises à jour de gradient géométriquement contraintes et des interventions au niveau des tokens, permet d'effacer efficacement des connaissances médicales spécifiques tout en préservant les compétences fondamentales et la confidentialité des données sensibles.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

Le papier présente CostNav, le premier benchmark ancré dans la physique qui évalue la viabilité économique des agents d'IA physiques en intégrant des données financières et réglementaires réelles, révélant ainsi que les méthodes actuelles de navigation, bien que performantes sur des tâches simplifiées, génèrent toutes des pertes économiques dans des scénarios commerciaux complexes.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Cet article propose un cadre d'apprentissage par renforcement partiellement équivariant (PI-MDP) qui adapte dynamiquement les mises à jour de Bellman pour gérer les bris de symétrie locaux, permettant ainsi d'améliorer l'efficacité de l'échantillonnage et la généralisation dans des environnements réalistes.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

Cross-embodied Co-design for Dexterous Hands

Cet article présente un cadre de co-conception qui apprend simultanément la morphologie spécifique à une tâche et les politiques de contrôle pour les mains robotiques, permettant de concevoir, entraîner, fabriquer et déployer une nouvelle main dextre en moins de 24 heures.

Kehlani Fay, Darin Anthony Djapri, Anya Zorin, James Clinton, Ali El Lahib, Hao Su, Michael T. Tolley, Sha Yi, Xiaolong Wang2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

Le papier présente AlphaQubit 2, un décodeur neuronal scalable et temps réel capable de corriger les erreurs des codes de surface et de couleur avec une précision quasi optimale et une vitesse supérieure à celle des méthodes existantes, ouvrant ainsi la voie à l'informatique quantique tolérante aux pannes.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

Le framework Trio propose une approche de découverte moléculaire en boucle fermée intégrant la modélisation linguistique, l'apprentissage par renforcement et la recherche arborescente pour générer des ligands ciblés à la fois valides, synthétisables et dotés d'une affinité de liaison améliorée, surpassant ainsi les méthodes de l'état de l'art.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Maximum Risk Minimization with Random Forests

Cet article propose des variantes de forêts aléatoires basées sur le principe de minimisation du risque maximal (MaxRM) pour améliorer la généralisation hors distribution, en fournissant des algorithmes efficaces, des preuves de consistance statistique et des garanties théoriques pour divers risques, y compris le regret.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas Peters2026-03-12📊 stat

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

Ce papier présente PvP, un cadre d'apprentissage contrastif exploitant les états proprioceptifs et privilégiés pour améliorer l'efficacité des échantillons dans le contrôle de robots humanoïdes, et introduit SRL4Humanoid, un cadre unifié pour l'évaluation systématique des méthodes d'apprentissage de représentations d'état.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Cet article présente le PBT (Pretrained Battery Transformer), un modèle fondamental pré-entraîné sur des données hétérogènes qui surpasse les méthodes existantes de 21,8 % en moyenne pour prédire universellement la durée de vie des batteries à travers diverses chimies et conditions de vieillissement.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

← Précédent Suivant →