cs.LG articles | Gist.Science

Dynamic Weight Grafting: Localizing Finetuned Factual Knowledge in Transformers

Cette étude propose une nouvelle technique d'analyse appelée greffe dynamique de poids pour révéler que les modèles de langage récupèrent les connaissances apprises lors du fine-tuning via deux voies distinctes : l'enrichissement du flux résiduel lors du traitement des entités et le rappel de l'information au moment de la prédiction finale.

Todd Nief, David Reber, Sean Richardson + 1 more2026-03-03🤖 cs.LG

TRIDENT: Tri-Modal Molecular Representation Learning with Taxonomic Annotations and Local Correspondence

Le papier présente TRIDENT, un cadre novateur d'apprentissage de représentations moléculaires tri-modales qui intègre les structures SMILES, les descriptions textuelles et les annotations taxonomiques fonctionnelles via des objectifs d'alignement global et local pour atteindre des performances de pointe dans la prédiction des propriétés moléculaires.

Feng Jiang, Mangal Prakash, Hehuan Ma + 6 more2026-03-03🤖 cs.LG

xLSTMAD: A Powerful xLSTM-based Method for Anomaly Detection

Ce papier présente xLSTMAD, la première méthode d'anomalie multivariée basée sur une architecture xLSTM complète (encodeur-décodeur) qui, en utilisant des fonctions de perte MSE ou SoftDTW sur 17 jeux de données réels, dépasse les performances de 23 méthodes de référence existantes.

Kamil Faber, Marcin Pietroń, Dominik Żurek + 1 more2026-03-03🤖 cs.AI

Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design

Cet article propose un cadre de fine-tuning itératif par distillation pour optimiser les modèles de diffusion dans la conception biomoléculaire selon des fonctions de récompense arbitraires, surmontant ainsi les limitations de stabilité et d'efficacité des méthodes d'apprentissage par renforcement traditionnelles.

Xingyu Su, Xiner Li, Masatoshi Uehara + 7 more2026-03-03🧬 q-bio

Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs

Ce papier propose la « Partial Model Collapse » (PMC), une méthode d'oubli machine qui exploite le phénomène d'effondrement des modèles pour supprimer des données sensibles sans avoir besoin de les inclure dans l'objectif d'apprentissage, résolvant ainsi les limites des approches actuelles tout en préservant l'utilité du modèle.

Yan Scholten, Sophie Xhonneux, Leo Schwinn + 1 more2026-03-03🤖 cs.AI

SlimCaching: Edge Caching of Mixture-of-Experts for Distributed Inference

Ce papier propose une méthode de décomposition greedy successive et un algorithme accéléré par convolution max pour optimiser la mise en cache des experts sur les serveurs de bord, afin de minimiser la latence d'inférence distribuée des modèles Mixture-of-Experts (MoE) malgré les contraintes de stockage et la non-sous-modularité introduite par la co-activation des experts.

Qian Chen, Xianhao Chen, Kaibin Huang2026-03-03🤖 cs.LG

Generating Multi-Table Time Series EHR from Latent Space with Minimal Preprocessing

Ce papier présente RawMed, le premier cadre capable de générer des dossiers médicaux électroniques (DME) synthétiques multi-tables et temporels à partir d'un espace latent avec un prétraitement minimal, surpassant les modèles existants en fidélité et en utilité tout en respectant la vie privée.

Eunbyeol Cho, Jiyoun Kim, Minjae Lee + 2 more2026-03-03🤖 cs.AI

A Projection-Based ARIMA Framework for Nonlinear Dynamics in Macroeconomic and Financial Time Series: Closed-Form Estimation and Rolling-Window Inference

Cet article présente Galerkin-ARIMA et Galerkin-SARIMA, une extension par projection des modèles classiques qui remplace les opérateurs de retard linéaires rigides par des expansions de base de Galerkin pour mieux capturer les dynamiques non linéaires dans les séries temporelles macroéconomiques et financières, tout en conservant une estimation sous forme close et une structure d'opérateurs AR-MA familière.

Haojie Liu, Zihan Lin2026-03-03📈 econ

Physics-Based Machine Learning Closures and Wall Models for Hypersonic Transition-Continuum Boundary Layer Predictions

Cette étude développe un cadre d'apprentissage machine contraint par la physique, combinant des modèles de réseaux de neurones pour les contraintes visqueuses et un modèle de paroi basé sur une distribution de vitesse de particules gaussienne biaisée, afin d'améliorer la précision des prédictions des écoulements hypersoniques dans le régime de transition continuum où les modèles classiques échouent.

Ashish S. Nair, Narendra Singh, Marco Panesi + 2 more2026-03-03🔬 physics

Separating Ansatz Discovery from Deployment on Larger Problems: Reinforcement Learning for Modular Circuit Design

Cet article propose une approche de Reinforcement Learning pour la conception modulaire de circuits quantiques, où une structure de bloc réutilisable est découverte sur de petits systèmes et ensuite déployée avec succès sur des problèmes plus grands, contournant ainsi la difficulté de modéliser de grands systèmes quantiques pour l'apprentissage automatique.

Gloria Turati, Simone FoderÃ, Riccardo Nembrini + 2 more2026-03-03⚛️ quant-ph

Minor Embedding for Quantum Annealing with Reinforcement Learning

Cet article propose une approche d'apprentissage par renforcement utilisant l'optimisation de politique proximale pour résoudre le problème coûteux du minor embedding dans l'optimisation quantique par recuit, démontrant ainsi sa capacité à générer des embeddings valides et évolutifs sur différentes topologies matérielles comme Chimera et Zephyr.

Riccardo Nembrini, Maurizio Ferrari Dacrema, Paolo Cremonesi2026-03-03⚛️ quant-ph

CASCADE: LLM-Powered JavaScript Deobfuscator at Google

Ce papier présente CASCADE, une approche hybride déployée chez Google qui combine les capacités de Gemini pour identifier les fonctions de préambule et les transformations déterministes d'une représentation intermédiaire du JavaScript (JSIR) afin de déobfusquer efficacement le code et de rétablir son comportement original.

Shan Jiang, Pranoy Kovuri, David Tao + 1 more2026-03-03🤖 cs.AI

Domain Generalization and Adaptation in Intensive Care with Anchor Regression

Cette étude présente une analyse à grande échelle de l'ancrage et du boosting d'ancrage pour améliorer la généralisation des modèles prédictifs en soins intensifs face aux décalages de distribution entre hôpitaux, tout en définissant un cadre conceptuel pour déterminer quand utiliser, adapter ou ignorer les données externes en fonction de la disponibilité des données cibles.

Malte Londschien, Manuel Burger, Gunnar Rätsch + 1 more2026-03-03📊 stat

Regime-Aware Conditional Neural Processes with Multi-Criteria Decision Support for Operational Electricity Price Forecasting

Cette étude propose un modèle de prévision des prix de l'électricité en Allemagne combinant la détection de régimes bayésienne et des processus neuronaux conditionnels, démontrant via une évaluation multicritère (TOPSIS) que cette approche offre une solution plus équilibrée et performante pour l'optimisation opérationnelle que les modèles d'apprentissage profond ou linéaires sur la période 2021-2023.

Abhinav Das, Stephan Schlüter2026-03-03📊 stat

DisTaC: Conditioning Task Vectors via Distillation for Robust Model Merging

Ce papier présente DisTaC, une méthode innovante qui utilise la distillation de connaissances pour pré-conditionner les vecteurs de tâches en ajustant leurs normes et en augmentant la confiance des modèles sources, permettant ainsi d'améliorer considérablement la robustesse et les performances du fusionnement de modèles dans des scénarios réalistes.

Kotaro Yoshida, Yuji Naraki, Takafumi Horie + 2 more2026-03-03🤖 cs.LG

HGTS-Former: Hierarchical HyperGraph Transformer for Multivariate Time Series Analysis

Cet article propose HGTS-Former, un nouveau modèle Transformer basé sur des hypergraphes hiérarchiques conçu pour améliorer l'analyse des séries temporelles multivariées en capturant les interactions complexes entre les variables, tout en présentant le nouveau jeu de données à grande échelle EAST-ELM640 pour la reconnaissance des modes localisés de bord (ELM) dans la fusion nucléaire.

Hao Si, Xiao Wang, Fan Zhang + 5 more2026-03-03🤖 cs.AI

Sample-Efficient Distributionally Robust Multi-Agent Reinforcement Learning via Online Interaction

Cet article présente l'algorithme MORNAVI, une méthode d'apprentissage en ligne pour les jeux de Markov robustes distribués qui permet aux agents d'apprendre directement par interaction avec l'environnement sans données préalables, tout en offrant les premières garanties théoriques de faible regret pour des ensembles d'incertitude mesurés par les divergences de variation totale et de Kullback-Leibler.

Zain Ulabedeen Farhat, Debamita Ghosh, George K. Atia + 1 more2026-03-03🤖 cs.LG

Next Generation Equation-Free Multiscale Modelling of Crowd Dynamics via Machine Learning

Cet article propose une approche d'apprentissage automatique informée par la variété pour modéliser la dynamique des foules à l'échelle macroscopique en apprenant un opérateur d'évolution dans un espace latent de faible dimension, tout en garantissant la conservation de la masse lors du passage des données microscopiques aux champs macroscopiques et inversement.

Hector Vargas Alvarez, Dimitrios G. Patsatzis, Lucia Russo + 2 more2026-03-03🤖 cs.LG

Do Vision-Language Models Leak What They Learn? Adaptive Token-Weighted Model Inversion Attacks

Cette étude présente la première analyse systématique des risques de fuite de données d'entraînement dans les modèles vision-langage via des attaques d'inversion de modèle, en proposant une nouvelle méthode d'optimisation adaptative (SMI-AW) qui démontre la vulnérabilité de ces modèles à reconstruire des images privées avec une précision significative.

Ngoc-Bao Nguyen, Sy-Tuyen Ho, Koh Jun Hao + 1 more2026-03-03🤖 cs.LG

Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment

Le papier présente Agnostics, un pipeline d'entraînement par renforcement universel qui permet d'apprendre à coder dans n'importe quel langage de programmation, y compris les ressources limitées, en se basant uniquement sur le comportement observable du code via un vérificateur unique, éliminant ainsi le besoin d'ingénierie spécifique par langage et établissant de nouveaux états de l'art pour les modèles de taille inférieure à 16 milliards de paramètres.

Aleksander Boruch-Gruszecki, Yangtian Zi, Zixuan Wu + 4 more2026-03-03🤖 cs.LG

← Précédent Suivant →