cs.LG articles | Gist.Science

Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation

Cette étude applique l'interprétabilité mécanistique à la distillation de connaissances pour révéler comment les modèles étudiants réorganisent et compressent les circuits internes des enseignants, entraînant des changements computationnels significatifs malgré la préservation des comportements fonctionnels globaux.

Reilly Haskins, Benjamin Adams2026-03-10🤖 cs.LG

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

Ce papier présente Ready2Unlearn, une approche proactive qui intègre la préparation à l'oubli machine directement durant la phase d'entraînement des modèles afin de faciliter et d'accélérer les futures demandes de suppression de données.

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

Ce papier présente EgoDex, le plus grand ensemble de données à ce jour pour la manipulation dextre, constitué de 829 heures de vidéos egocentriques annotées avec des poses 3D des mains collectées via Apple Vision Pro, afin de pallier le manque de données à grande échelle et de faire progresser l'apprentissage par imitation en robotique.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

Le papier présente FreeKV, un cadre d'optimisation conjointe algorithmique et système sans entraînement qui améliore l'efficacité de la récupération du cache KV pour l'inférence des grands modèles de langage, permettant des accélérations allant jusqu'à 13 fois par rapport aux méthodes de l'état de l'art tout en préservant une précision quasi parfaite.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

Online Decision-Focused Learning

Cet article propose la première approche théoriquement garantie pour l'apprentissage axé sur la décision en ligne dans des environnements dynamiques, en régularisant la fonction objectif et en utilisant des techniques de perturbation pour surmonter l'absence de gradients et la non-convexité, tout en établissant des bornes de regret et en validant l'efficacité de l'algorithme sur un problème de sac à dos.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain Durmus2026-03-10🤖 cs.LG

Vid2World: Crafting Video Diffusion Models to Interactive World Models

Le papier présente Vid2World, une méthode générale qui transforme des modèles de diffusion vidéo pré-entraînés en modèles de monde interactifs en adaptant leur architecture pour la génération autoregressive et en intégrant un mécanisme de guidage causal pour améliorer le contrôle par les actions.

Siqiao Huang, Jialong Wu, Qixing Zhou, Shangchen Miao, Mingsheng Long2026-03-10🤖 cs.LG

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

Le papier présente MAS-ZERO, un cadre d'inférence temps réel pionnier qui conçoit et affine automatiquement des systèmes multi-agents sans supervision ni ensemble de validation, en adaptant dynamiquement la décomposition des problèmes et la composition des agents pour surpasser les approches manuelles et automatiques existantes sur diverses tâches complexes.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

Le papier présente HDLxGraph, un cadre innovant qui intègre les caractéristiques graphiques inhérentes aux langages de description matérielle (HDL) aux systèmes de génération augmentée par récupération (RAG) pour surmonter les limites des approches actuelles dans la recherche, le débogage et la complétion de projets HDL complexes, tout en introduisant le benchmark HDLSearch pour évaluer ces performances.

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

Ce papier présente WikiDBGraph, une nouvelle suite de benchmark à grande échelle construite à partir de 100 000 bases de données réelles interconnectées, conçue pour évaluer les limites des méthodes d'apprentissage collaboratif face aux défis réels de gestion des silos de données fragmentés et non alignés.

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Ce papier présente AgarCL, une plateforme de recherche basée sur le jeu Agar.io conçue pour évaluer l'apprentissage par renforcement continu dans un environnement non épisodique et dynamique, tout en démontrant que les méthodes actuelles d'apprentissage continu peinent à surpasser les algorithmes standards face aux défis spécifiques de ce cadre.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Ce papier présente X-MethaneWet, le premier jeu de données de référence mondial multi-échelles pour les émissions de méthane des zones humides, qui combine des simulations physiques et des observations réelles pour entraîner des modèles d'apprentissage profond et explorer des techniques d'apprentissage par transfert afin d'améliorer la précision de la modélisation climatique.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Cet article propose un cadre théorique général pour le contrôle optimal de la densité de probabilité, établissant un principe du maximum et une équation de Hamilton-Jacobi-Bellman sur des espaces de distributions, puis introduisant un algorithme numérique évolutif basé sur les réseaux de neurones profonds pour résoudre des problèmes de contrôle multi-agents à grande échelle.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

Ce papier présente VISTA, un cadre novateur et sans entraînement qui exploite les modèles vision-langage pour prédire les cours boursiers en combinant des représentations textuelles et visuelles des données historiques, surpassant ainsi significativement les méthodes traditionnelles et unimodales.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Cet article propose une nouvelle méthode de défense contre les injections de prompts dans les grands modèles de langage en injectant un signal de hiérarchie des instructions directement dans les représentations intermédiaires du réseau, ce qui réduit considérablement le taux de réussite des attaques par rapport aux approches existantes sans dégrader l'utilité du modèle.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Ce papier propose OCN, une nouvelle méthode de prédiction de liens qui surpasse les approches existantes en éliminant la redondance et le lissage excessif des voisins communs d'ordres supérieurs grâce à des techniques d'orthogonalisation et de normalisation.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Le papier présente ViTaPEs, une architecture transformer innovante qui améliore l'alignement cross-modal et la généralisation zéro-shot en intégrant un schéma d'encodage positionnel à deux étapes (local et global) pour fusionner efficacement les perceptions visuelle et tactile.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

Le papier présente LoFT, une méthode d'adaptation à faible rang qui aligne la dynamique de l'optimiseur avec celle du fine-tuning complet en projetant les moments d'Adam dans le sous-espace de rang faible, permettant ainsi de combler l'écart de performance avec le fine-tuning complet sans coût d'inférence supplémentaire ni besoin de réglage d'hyperparamètres.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Cet article propose ProNC, un cadre novateur d'apprentissage continu qui résout l'oubli catastrophique en remplaçant l'ETF global fixe par une expansion progressive et flexible des prototypes de classe, surpassant ainsi les méthodes existantes en performance et en efficacité.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Cet article propose une méthode de correction adaptative et modulaire qui intègre un opérateur apprenable pour garantir strictement la conservation des lois physiques dans les opérateurs neuronaux, améliorant ainsi leur précision et leur stabilité par rapport aux techniques existantes.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

Le papier présente ActivePusher, un cadre novateur combinant la modélisation par physique résiduelle et l'apprentissage actif basé sur l'incertitude pour améliorer l'efficacité des données et la réussite de la planification à long terme dans la manipulation non préhensile.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

← Précédent Suivant →