cs.LG articles | Gist.Science

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Ce papier présente le Self-Distilled Reasoner, un cadre d'auto-distillation sur politique où un seul modèle joue à la fois le rôle d'enseignant (conditionné sur des traces de raisonnement privilégiées) et d'élève (ne voyant que la question), permettant d'améliorer les capacités de raisonnement mathématique avec une efficacité tokenique bien supérieure aux méthodes d'apprentissage par renforcement.

Siyan Zhao, Zhihui Xie, Mengchen Liu + 4 more2026-03-06💻 cs

A Scalable Inter-edge Correlation Modeling in CopulaGNN for Link Sign Prediction

Cet article propose une méthode évolutive pour la prédiction du signe des liens dans les graphes signés, qui modélise directement les dépendances statistiques entre les arêtes à l'aide d'une copule gaussienne tout en surmontant les limitations de complexité computationnelle grâce à une représentation factorisée de la matrice de corrélation et une reformulation de la distribution de probabilité conditionnelle.

Jinkyu Sung, Myunggeum Jee, Joonseok Lee2026-03-06💻 cs

Improved Convergence Rates of Muon Optimizer for Nonconvex Optimization

Cet article établit des garanties de convergence plus précises et rapides pour l'optimiseur Muon en utilisant une analyse directe et simplifiée qui s'affranchit des hypothèses restrictives des travaux antérieurs, offrant ainsi une caractérisation théorique améliorée applicable à une plus large gamme de problèmes d'optimisation non convexe.

Shuntaro Nagashima, Hideaki Iiduka2026-03-06🔢 math

Latent-IMH: Efficient Bayesian Inference for Inverse Problems with Approximate Operators

L'article présente Latent-IMH, une méthode d'échantillonnage bayésien efficace pour les problèmes inverses linéaires avec des opérateurs coûteux, qui génère des variables latentes via une approximation rapide avant de les affiner avec l'opérateur exact, surpassant ainsi des méthodes de l'état de l'art comme NUTS en termes d'efficacité computationnelle.

Youguang Chen, George Biros2026-03-06🔢 math

Mobility-Embedded POIs: Learning What A Place Is and How It Is Used from Human Movement

Ce papier présente ME-POIs, un cadre novateur qui enrichit les représentations des points d'intérêt en fusionnant des données textuelles avec des schémas de mobilité humaine à grande échelle pour capturer non seulement l'identité d'un lieu, mais aussi sa fonction réelle, surpassant ainsi les approches existantes sur plusieurs tâches d'enrichissement cartographique.

Maria Despoina Siampou, Shushman Choudhury, Shang-Ling Hsu + 2 more2026-03-06💻 cs

YuriiFormer: A Suite of Nesterov-Accelerated Transformers

Ce papier propose un cadre variationnel interprétant les couches des transformers comme des itérations d'algorithmes d'optimisation, permettant de concevoir une architecture accélérée par Nesterov qui surpasse les modèles de base sur des tâches de génération de texte.

Aleksandr Zimin, Yury Polyanskiy, Philippe Rigollet2026-03-06🔢 math

MiTA Attention: Efficient Fast-Weight Scaling via a Mixture of Top-k Activations

Ce papier propose MiTA, une nouvelle méthode d'attention efficace qui unifie les approches existantes et améliore l'évolutivité des séquences longues en compressant les poids rapides via une stratégie de routage et de sélection des k meilleures activations.

Qishuai Wen, Zhiyuan Huang, Xianghan Meng + 2 more2026-03-06💻 cs

Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

Le papier présente VIP, une stratégie d'allocation de rollouts adaptative qui optimise l'efficacité de l'apprentissage par renforcement en ligne en attribuant dynamiquement le budget de calcul aux prompts les plus informatifs pour minimiser la variance du gradient, surpassant ainsi les méthodes d'allocation uniforme.

Hieu Trung Nguyen, Bao Nguyen, Wenao Ma + 3 more2026-03-06💻 cs

Position: Beyond Model-Centric Prediction -- Agentic Time Series Forecasting

Cet article propose une nouvelle approche de la prévision des séries temporelles, appelée « prévision agentielle », qui dépasse le paradigme traditionnel centré sur le modèle en la reformulant comme un processus dynamique intégrant perception, planification, action, réflexion et mémoire pour permettre une adaptation continue et une interaction avec des outils.

Mingyue Cheng, Xiaoyu Tao, Qi Liu + 2 more2026-03-06💻 cs

On the Non-Identifiability of Steering Vectors in Large Language Models

Cet article démontre que les vecteurs de pilotage dans les grands modèles de langage sont fondamentalement non identifiables, car des perturbations orthogonales peuvent produire des effets comportementaux équivalents, révélant ainsi des limites inhérentes à l'interprétabilité de ces interventions.

Sohan Venkatesh, Ashish Mahendran Kurapath2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

LatentChem introduit une interface de raisonnement latent qui découple le calcul chimique de la génération textuelle, permettant aux modèles d'effectuer des inférences complexes dans un espace continu pour obtenir des performances supérieures et une accélération significative par rapport aux méthodes traditionnelles basées sur la chaîne de pensée explicite.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

Beyond the Unit Hypersphere: Embedding Magnitude in Contrastive Learning

Ce papier démontre que l'apprentissage de la magnitude des embeddings, plutôt que de la simple similarité cosinus, améliore significativement les performances en recherche d'information et en RAG en exploitant des rôles distincts pour les magnitudes des requêtes et des documents, au détriment des tâches où les entrées sont interchangeables.

Xincan Feng, Taro Watanabe2026-03-06💻 cs

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Cet article propose le TAPINN, une architecture de réseaux de neurones informés par la physique qui utilise une régularisation métrique supervisée et une optimisation alternée pour surmonter les biais spectraux et les effondrements de modes lors de la modélisation de systèmes dynamiques à transitions de régime abruptes, comme le démontrent des résultats supérieurs sur l'oscillateur de Duffing.

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

Cette étude empirique démontre que, malgré des performances compétitives sur certains résidus polynomiaux, les réseaux KAN intégrés dans des architectures HRPINN souffrent d'une fragilité hyperparamétrique et d'une instabilité qui les rendent généralement moins efficaces que les MLP pour la découverte de termes multiplicatifs et de couplages d'états dans les systèmes oscillatoires.

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich2026-03-06🔬 physics

Learn from Your Mistakes: Self-Correcting Masked Diffusion Models

Ce papier propose ProSeCo, un cadre d'apprentissage pour les modèles de diffusion masqués qui intègre des étapes de correction itératives afin de réviser les tokens déjà générés, réduisant ainsi l'accumulation d'erreurs et améliorant la qualité des échantillons tout en accélérant l'inférence.

Yair Schiff, Omer Belhasin, Roy Uziel + 5 more2026-03-06💻 cs

QTabGAN: A Hybrid Quantum-Classical GAN for Tabular Data Synthesis

Ce papier présente QTabGAN, un cadre hybride quantique-classique conçu pour générer des données tabulaires réalistes dans des contextes de données rares ou privées, démontrant une amélioration significative des performances par rapport aux modèles existants.

Subhangi Kumari, Rakesh Achutha, Vignesh Sivaraman2026-03-06⚛️ quant-ph

Out-of-Support Generalisation via Weight-Space Sequence Modelling

Ce papier présente WeightCaster, un cadre innovant qui reformule la généralisation hors-distribution comme une tâche de modélisation de séquence dans l'espace des poids pour produire des prédictions fiables et incertaines sans biais inductif explicite, surpassant les méthodes actuelles sur des données synthétiques et réelles.

Roussel Desmond Nzoyem2026-03-06💻 cs

Neural Network-Based Parameter Estimation of a Labour Market Agent-Based Model

Cette étude démontre qu'un cadre d'inférence basé sur les simulations utilisant des réseaux de neurones permet d'estimer efficacement les paramètres d'un modèle agent-based du marché du travail, surpassant les méthodes bayésiennes traditionnelles en précision et en rapidité.

M Lopes Alves, Joel Dyer, Doyne Farmer + 2 more2026-03-06💻 cs

Optimal training-conditional regret for online conformal prediction

Cet article propose des algorithmes de prédiction conforme en ligne, adaptés à la détection de dérive, qui atteignent un regret cumulatif conditionnel à l'entraînement optimal pour des flux de données non stationnaires, que les scores de non-conformité soient préentraînés ou mis à jour en ligne.

Jiadong Liang, Zhimei Ren, Yuxin Chen2026-03-06🔢 math

SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework

SubQuad est une pipeline intégrée qui surmonte les goulots d'étranglement computationnels et les déséquilibres de données dans l'analyse des répertoires immunitaires à grande échelle en combinant une récupération quasi sous-quadratique, des noyaux d'affinité accélérés par GPU et des objectifs de clustering équitables pour améliorer l'efficacité et l'équité dans la découverte de biomarqueurs.

Rong Fu, Zijian Zhang, Kun Liu + 3 more2026-03-06💻 cs

← Précédent Suivant →