cs.LG articles | Gist.Science

From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

Ce papier présente KMP-Bench, une nouvelle évaluation complète pour les modèles de langage en mathématiques (K-8) qui révèle un décalage entre leurs capacités de résolution et leurs compétences pédagogiques, tout en démontrant l'efficacité d'un jeu de données d'entraînement enrichi, KMP-Pile, pour améliorer leurs performances en tant que tuteurs.

Weikang Shi, Houxing Ren, Junting Pan + 8 more2026-03-04💬 cs.CL

Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies

Cet article présente un cadre d'apprentissage par imitation génératif adversaire permettant à des essaims de robots d'acquérir des comportements collectifs à partir de démonstrations humaines ou de politiques entraînées, avec une validation réussie en simulation et sur des robots TurtleBot 4 réels.

Mattes Kraus, Jonas Kuckling2026-03-04🤖 cs.LG

From Heuristic Selection to Automated Algorithm Design: LLMs Benefit from Strong Priors

En démontrant que l'intégration d'exemples d'algorithmes de haute qualité issus de benchmarks améliore significativement les performances des modèles de langage pour la conception automatisée d'algorithmes, cette étude propose une approche fondée sur des priors solides qui surpasse les méthodes existantes sur des problèmes d'optimisation en boîte noire.

Qi Huang, Furong Ye, Ananta Shahane + 2 more2026-03-04🤖 cs.LG

Differentiable Time-Varying IIR Filtering for Real-Time Speech Denoising

Cet article présente TVF, un modèle d'amélioration de la parole à faible latence et interprétable qui combine un réseau de neurones léger avec un filtre IIR différentiable à 35 bandes pour s'adapter dynamiquement au bruit non stationnaire en temps réel.

Riccardo Rota, Kiril Ratmanski, Jozef Coldenhoff + 1 more2026-03-04⚡ eess

The Price of Robustness: Stable Classifiers Need Overparameterization

Cet article établit que pour les classifieurs discontinus, une stabilité élevée (robustesse) nécessite une surparamétrisation substantielle, car les modèles interpolants avec un nombre de paramètres proche de celui des données sont intrinsèquement instables.

Jonas von Berg, Adalbert Fono, Massimiliano Datres + 2 more2026-03-04🤖 cs.LG

Lattice-based Deep Neural Networks: Regularity and Tailored Regularization

Cet article de synthèse examine l'application des règles de réseau aux réseaux de neurones profonds, démontrant que l'utilisation de points d'entraînement adaptés et d'une régularisation ciblée permet d'obtenir des bornes d'erreur de généralisation indépendantes de la dimension et des performances numériques supérieures à la régularisation $\ell_2$ standard.

Alexander Keller, Frances Y. Kuo, Dirk Nuyens + 1 more2026-03-04🤖 cs.LG

ChemFlow:A Hierarchical Neural Network for Multiscale Representation Learning in Chemical Mixtures

Le papier présente ChemFlow, un cadre d'apprentissage hiérarchique innovant qui intègre des caractéristiques atomiques, de groupes fonctionnels et moléculaires pour prédire avec une précision supérieure les propriétés physicochimiques des mélanges chimiques complexes en tenant compte de leur composition et de leurs concentrations.

Jinming Fan, Chao Qian, Wilhelm T. S. Huck + 2 more2026-03-04🤖 cs.LG

Adapting Time Series Foundation Models through Data Mixtures

L'article propose MixFT, une méthode qui améliore l'adaptation des modèles de base pour séries temporelles en réorganisant les données en sous-domaines homogènes via des mélanges bayésiens pour un affinage plus efficace que les approches par jeu de données ou module unique.

Thomas L. Lee, Edoardo M. Ponti, Amos Storkey2026-03-04📊 stat

Scale-invariant Gaussian derivative residual networks

Cet article présente les GaussDerResNets, des réseaux de neurones résiduels fondés sur des dérivées gaussiennes qui, grâce à leurs propriétés de covariance et d'invariance d'échelle prouvées, permettent d'atteindre une forte précision tout en assurant une excellente généralisation à des échelles d'image non vues lors de l'entraînement.

Andrzej Perzanowski, Tony Lindeberg2026-03-04🤖 cs.LG

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling

Cet article propose MIStar, un cadre d'amélioration de recherche enrichi par la mémoire et basé sur une représentation graphique hétérogène, qui surpasse les méthodes existantes pour résoudre le problème d'ordonnancement flexible d'atelier grâce à l'apprentissage par renforcement profond et à une stratégie de recherche parallèle.

Jiaqi Wang, Zhiguang Cao, Peng Zhao + 4 more2026-03-04🤖 cs.AI

Distributed Dynamic Invariant Causal Prediction in Environmental Time Series

Cet article propose DisDy-ICPT, un nouveau cadre distribué permettant d'identifier des relations causales dynamiques et invariantes dans les séries temporelles environnementales sans échange de données, garantissant ainsi une stabilité prédictive supérieure pour des applications comme la surveillance du carbone et la prévision météorologique.

Ziruo Hao, Tao Yang, Xiaofeng Wu + 1 more2026-03-04🤖 cs.LG

Towards Accurate and Interpretable Time-series Forecasting: A Polynomial Learning Approach

Cet article propose une méthode d'apprentissage polynomial interprétable (IPL) qui améliore la précision et l'interprétabilité des prévisions de séries temporelles en modélisant explicitement les interactions de caractéristiques, facilitant ainsi la maintenance prédictive et les mécanismes d'alerte précoce.

Bo Liu, Shao-Bo Lin, Changmiao Wang + 1 more2026-03-04📊 stat

Eliciting Numerical Predictive Distributions of LLMs Without Autoregression

Cette étude démontre qu'il est possible de récupérer les propriétés distributionnelles des prédictions numériques des grands modèles de langage, y compris l'incertitude, directement à partir de leurs représentations internes via des sondes d'apprentissage, évitant ainsi le coût computationnel élevé des méthodes d'échantillonnage autoregressif.

Julianna Piskorz, Katarzyna Kobalczyk, Mihaela van der Schaar2026-03-04🤖 cs.AI

On the Structural Limitations of Weight-Based Neural Adaptation and the Role of Reversible Behavioral Learning

Cette étude propose le concept d'apprentissage comportemental réversible pour surmonter l'irréversibilité structurelle des adaptations neuronales basées sur les poids partagés, permettant ainsi un retour déterministe au comportement original du modèle sans divergence persistante.

Pardhu Sri Rushi Varma Konduru2026-03-04🤖 cs.AI

Contextual Latent World Models for Offline Meta Reinforcement Learning

Cet article présente les modèles de monde latents contextuels, une méthode qui combine l'apprentissage de représentations de tâches et de modèles de monde pour améliorer la généralisation du méta-apprentissage par renforcement hors ligne sur divers benchmarks.

Mohammadreza Nakheai, Aidan Scannell, Kevin Luck + 1 more2026-03-04🤖 cs.LG

Bias and Fairness in Self-Supervised Acoustic Representations for Cognitive Impairment Detection

Cette étude révèle que, bien que les représentations acoustiques contextuelles de Wav2Vec 2.0 surpassent les méthodes traditionnelles pour la détection des troubles cognitifs, elles présentent des biais significatifs défavorisant les femmes et les participants plus jeunes, soulignant ainsi la nécessité d'évaluations équitables dans les applications cliniques de la parole.

Kashaf Gulzar, Korbinian Riedhammer, Elmar Nöth + 2 more2026-03-04⚡ eess

Beyond One-Size-Fits-All: Adaptive Subgraph Denoising for Zero-Shot Graph Learning with Large Language Models

Le papier présente GraphSSR, un cadre innovant qui améliore l'apprentissage de graphes en zéro-shot avec des modèles de langage en remplaçant les stratégies d'extraction de sous-graphes génériques par une approche adaptative de débruitage via un processus « Échantillonner-Sélectionner-Raisonner » optimisé par l'ajustement fin et l'apprentissage par renforcement.

Fengzhi Li, Liang Zhang, Yuan Zuo + 5 more2026-03-04🤖 cs.AI

Enhancing Physics-Informed Neural Networks with Domain-aware Fourier Features: Towards Improved Performance and Interpretable Results

Cet article propose une approche novatrice améliorant les réseaux de neurones informés par la physique (PINN) grâce à l'utilisation de caractéristiques de Fourier spécifiques au domaine (DaFF) pour un encodage positionnel optimisé et d'un cadre d'explicabilité basé sur LRP, permettant d'obtenir une précision supérieure, une convergence plus rapide et une interprétabilité physiquement cohérente par rapport aux méthodes existantes.

Alberto Miño Calero, Luis Salamanca, Konstantinos E. Tatsis2026-03-04🤖 cs.AI

Sparse autoencoders reveal organized biological knowledge but minimal regulatory logic in single-cell foundation models: a comparative atlas of Geneformer and scGPT

Cette étude démontre que les modèles de fondation du single-cell Geneformer et scGPT intègrent une connaissance biologique organisée et hiérarchique révélée par des autoencodeurs clairsemés, mais qu'ils encodent une logique de régulation causale minimale face aux données de perturbation génomique.

Ihor Kendiukhov2026-03-04🧬 q-bio

Leveraging Label Proportion Prior for Class-Imbalanced Semi-Supervised Learning

Cet article propose un cadre léger intégrant une nouvelle fonction de perte de proportion, issue de l'apprentissage à partir de proportions d'étiquettes, pour atténuer les biais de classe dans l'apprentissage semi-supervisé déséquilibré et améliorer significativement les performances sur des benchmarks comme CIFAR-10 à longue traîne.

Kohki Akiba, Shinnosuke Matsuo, Shota Harada + 1 more2026-03-04🤖 cs.LG

← Précédent Suivant →