cs.LG articles | Gist.Science

Meta-RL Induces Exploration in Language Agents

Ce papier présente LaMer, un cadre d'apprentissage par renforcement méta (Meta-RL) qui permet aux agents de modèles de langage d'explorer activement et de s'adapter en contexte grâce à la réflexion, surpassant ainsi les méthodes RL classiques sur des tâches complexes nécessitant une exploration à long terme.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

Le papier présente Re-Depth Anything, un cadre d'auto-supervision à l'inférence qui améliore l'estimation de profondeur monoculaire en fusionnant les modèles de fondation avec des modèles de diffusion 2D pour rééclairer et résynthétiser l'image, permettant ainsi des résultats de pointe sans nécessiter d'étiquettes.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Cet article propose trois stratégies complémentaires pour accélérer l'entraînement des réseaux de Kolmogorov-Arnold (KAN) basés sur la méthode Newton-Kaczmarz : un pré-entraînement adapté, l'entraînement sur des sous-ensembles de données disjoints suivi d'une fusion de modèles, et une implémentation parallèle sur FPGA, le tout avec des résultats entièrement reproductibles.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Cet article propose « Latent Sculpting », une architecture d'apprentissage hiérarchique combinant un encodeur Transformer et un flot autorégressif masqué pour structurer géométriquement l'espace latent et détecter avec succès des anomalies cybernétiques inconnues (zero-shot) dans des données tabulaires, surpassant ainsi les méthodes existantes sur des attaques furtives et des variations de déni de service.

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

Ce papier propose FedORA, une méthode d'optimisation primale-duale certifiée qui permet l'oubli efficace d'échantillons et d'étiquettes dans l'apprentissage fédéré vertical en résolvant un problème d'optimisation contraint avec une nouvelle fonction de perte favorisant l'incertitude, tout en garantissant théoriquement l'efficacité de l'oubli et en réduisant les coûts de calcul par rapport au réentraînement complet.

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Network Traffic Analysis with Process Mining: The UPSIDE Case Study

Cette étude propose une méthode d'extraction de processus appliquée au trafic réseau du jeu vidéo pour caractériser sans supervision les états du réseau via des réseaux de Petri interprétables et classifier avec précision les jeux, comme démontré par l'analyse des données du cas UPSIDE pour Clash Royale et Rocket League.

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca2026-03-10🤖 cs.LG

Topological Spatial Graph Coarsening

Cet article propose une méthode sans paramètre pour la coarsening de graphes spatiaux qui réduit leur taille en repliant les arêtes courtes tout en préservant leurs caractéristiques topologiques grâce à une nouvelle filtration adaptée aux diagrammes de persistance.

Anna Calissano, Etienne Lasalle2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

Ce papier propose des méthodes actor-critic avec des oracles d'estimation robustes et clairsemés pour obtenir les premières garanties non triviales d'apprentissage d'une politique quasi optimale dans des processus de décision markoviens haute dimension et clairsemés, même en présence de corruption forte des données et d'une couverture limitée à une seule politique.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Group Cross-Correlations with Faintly Constrained Filters

Cet article propose des contraintes plus faibles pour les filtres dans les réseaux de neurones à convolution de groupe, permettant de réduire le nombre de nœuds tout en résolvant des incompatibilités avec les stabilisateurs non compacts et en généralisant les résultats aux actions non transitives et aux groupes non unimodulaires.

Benedikt Fluhr2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

Cette étude propose un cadre d'évaluation axé sur la sécurité pour la prévision de charge électrique, démontrant que les métriques de précision standards masquent des risques opérationnels critiques et introduisant des modèles d'espace d'état optimisés avec des contraintes de biais pour équilibrer la fiabilité des réserves et éviter les sur-prévisions coûteuses.

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Cet article propose une méthode d'inférence bayésienne amortie adaptée aux données graphiques, combinant des encodeurs invariants par permutation et des estimateurs de posterior neuronaux pour effectuer une inférence rapide et sans vraisemblance sur des paramètres de nœuds, d'arêtes et de graphes dans des domaines variés allant de la biologie à la logistique.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

Le papier présente DevBench, un benchmark réaliste et fondé sur des données de télémétrie de développeurs qui évalue neuf modèles de langage avancés sur des tâches de complétion de code en privilégiant la validité écologique et des diagnostics détaillés pour guider leur déploiement pratique.

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

Ce premier sondage systématique examine les interactions bidirectionnelles entre les grands modèles de langage et les bandits multi-bras, en démontrant comment ces derniers résolvent des défis clés des LLM tandis que les LLM redéfinissent les composants fondamentaux des algorithmes de bandits pour améliorer la prise de décision séquentielle.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

Le papier propose ELSA, un cadre novateur combinant l'apprentissage fractionné et l'apprentissage fédéré hiérarchique pour optimiser le fine-tuning de modèles de langage à grande échelle sur le réseau de périphérie tout en garantissant la confidentialité des données et en surmontant les contraintes de ressources et d'hétérogénéité.

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Cet article propose une architecture d'inférence CNN continue et adaptée au débit de données pour FPGA, qui résout le problème de sous-utilisation des unités matérielles causé par la réduction du flux de données dans les couches de convolution et de pooling, permettant ainsi d'atteindre une utilisation matérielle proche de 100 % et d'exécuter des réseaux complexes comme MobileNet sur une seule puce avec un haut débit.

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

Le papier présente MeanCache, un cadre d'accélération sans entraînement pour l'inférence Flow Matching qui remplace le cache de vitesse instantanée par une approche de vitesse moyenne utilisant des produits Jacobien-vecteur, permettant d'obtenir des accélérations allant jusqu'à 4,56 fois sur des modèles de pointe comme FLUX.1 tout en préservant la qualité de génération.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

PASS: Certified Subset Repair for Classical and Quantum Pairwise Constrained Clustering

Le framework PASS propose une méthode évolutive pour le clustering k-moyennes avec contraintes pairwise, qui optimise un sous-ensemble réduit tout en garantissant la faisabilité des contraintes de type « cannot-link » via un certificat de réparation vérifiable, permettant ainsi des solutions efficaces sur des instances complexes où les méthodes de référence échouent.

Pedro Chumpitaz-Flores, My Duong, Ying Mao, Kaixun Hua2026-03-10🤖 cs.LG

Model-Free Neural State Estimation in Nonlinear Dynamical Systems: Comparing Neural and Classical Filters

Cette étude présente une comparaison systématique montrant que les modèles neuronaux sans modèle, en particulier les réseaux d'état d'espace, atteignent des performances d'estimation d'état comparables aux filtres de Kalnon linéaires forts et surpassent les méthodes classiques plus faibles, tout en offrant un débit d'inférence nettement supérieur.

Zhuochen Liu, Hans Walker, Rahul Jain2026-03-10🤖 cs.LG

TimeSliver : Symbolic-Linear Decomposition for Explainable Time Series Classification

Le papier présente TimeSliver, un cadre d'apprentissage profond novateur qui combine données temporelles brutes et abstraction symbolique pour fournir une classification de séries temporelles à la fois performante et hautement explicable en attribuant des scores d'importance précis à chaque segment temporel.

Akash Pandey, Payal Mohapatra, Wei Chen, Qi Zhu, Sinan Keten2026-03-10🤖 cs.LG

Transferable Graph Condensation from the Causal Perspective

Ce papier propose TGCC, une nouvelle méthode de condensation de graphes fondée sur l'invariance causale qui extrait des caractéristiques invariantes au domaine et les injecte via un apprentissage contrastif spectral pour améliorer significativement les performances dans des scénarios de transfert inter-domaines et inter-tâches.

Huaming Du, Yijie Huang, Su Yao, Yiying Wang, Yueyang Zhou, Jingwen Yang, Jinshi Zhang, Han Ji, Yu Zhao, Guisong Liu, Hegui Zhang, Carl Yang, Gang Kou2026-03-10🤖 cs.LG

← Précédent Suivant →