cs.LG articles | Gist.Science

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling

Cet article propose MIStar, un cadre d'amélioration de recherche enrichi par la mémoire et basé sur une représentation graphique hétérogène, qui surpasse les méthodes existantes pour résoudre le problème d'ordonnancement flexible d'atelier grâce à l'apprentissage par renforcement profond et à une stratégie de recherche parallèle.

Jiaqi Wang, Zhiguang Cao, Peng Zhao + 4 more2026-03-04🤖 cs.AI

Distributed Dynamic Invariant Causal Prediction in Environmental Time Series

Cet article propose DisDy-ICPT, un nouveau cadre distribué permettant d'identifier des relations causales dynamiques et invariantes dans les séries temporelles environnementales sans échange de données, garantissant ainsi une stabilité prédictive supérieure pour des applications comme la surveillance du carbone et la prévision météorologique.

Ziruo Hao, Tao Yang, Xiaofeng Wu + 1 more2026-03-04🤖 cs.LG

Towards Accurate and Interpretable Time-series Forecasting: A Polynomial Learning Approach

Cet article propose une méthode d'apprentissage polynomial interprétable (IPL) qui améliore la précision et l'interprétabilité des prévisions de séries temporelles en modélisant explicitement les interactions de caractéristiques, facilitant ainsi la maintenance prédictive et les mécanismes d'alerte précoce.

Bo Liu, Shao-Bo Lin, Changmiao Wang + 1 more2026-03-04📊 stat

Eliciting Numerical Predictive Distributions of LLMs Without Autoregression

Cette étude démontre qu'il est possible de récupérer les propriétés distributionnelles des prédictions numériques des grands modèles de langage, y compris l'incertitude, directement à partir de leurs représentations internes via des sondes d'apprentissage, évitant ainsi le coût computationnel élevé des méthodes d'échantillonnage autoregressif.

Julianna Piskorz, Katarzyna Kobalczyk, Mihaela van der Schaar2026-03-04🤖 cs.AI

On the Structural Limitations of Weight-Based Neural Adaptation and the Role of Reversible Behavioral Learning

Cette étude propose le concept d'apprentissage comportemental réversible pour surmonter l'irréversibilité structurelle des adaptations neuronales basées sur les poids partagés, permettant ainsi un retour déterministe au comportement original du modèle sans divergence persistante.

Pardhu Sri Rushi Varma Konduru2026-03-04🤖 cs.AI

Contextual Latent World Models for Offline Meta Reinforcement Learning

Cet article présente les modèles de monde latents contextuels, une méthode qui combine l'apprentissage de représentations de tâches et de modèles de monde pour améliorer la généralisation du méta-apprentissage par renforcement hors ligne sur divers benchmarks.

Mohammadreza Nakheai, Aidan Scannell, Kevin Luck + 1 more2026-03-04🤖 cs.LG

Bias and Fairness in Self-Supervised Acoustic Representations for Cognitive Impairment Detection

Cette étude révèle que, bien que les représentations acoustiques contextuelles de Wav2Vec 2.0 surpassent les méthodes traditionnelles pour la détection des troubles cognitifs, elles présentent des biais significatifs défavorisant les femmes et les participants plus jeunes, soulignant ainsi la nécessité d'évaluations équitables dans les applications cliniques de la parole.

Kashaf Gulzar, Korbinian Riedhammer, Elmar Nöth + 2 more2026-03-04⚡ eess

Beyond One-Size-Fits-All: Adaptive Subgraph Denoising for Zero-Shot Graph Learning with Large Language Models

Le papier présente GraphSSR, un cadre innovant qui améliore l'apprentissage de graphes en zéro-shot avec des modèles de langage en remplaçant les stratégies d'extraction de sous-graphes génériques par une approche adaptative de débruitage via un processus « Échantillonner-Sélectionner-Raisonner » optimisé par l'ajustement fin et l'apprentissage par renforcement.

Fengzhi Li, Liang Zhang, Yuan Zuo + 5 more2026-03-04🤖 cs.AI

Enhancing Physics-Informed Neural Networks with Domain-aware Fourier Features: Towards Improved Performance and Interpretable Results

Cet article propose une approche novatrice améliorant les réseaux de neurones informés par la physique (PINN) grâce à l'utilisation de caractéristiques de Fourier spécifiques au domaine (DaFF) pour un encodage positionnel optimisé et d'un cadre d'explicabilité basé sur LRP, permettant d'obtenir une précision supérieure, une convergence plus rapide et une interprétabilité physiquement cohérente par rapport aux méthodes existantes.

Alberto Miño Calero, Luis Salamanca, Konstantinos E. Tatsis2026-03-04🤖 cs.AI

Sparse autoencoders reveal organized biological knowledge but minimal regulatory logic in single-cell foundation models: a comparative atlas of Geneformer and scGPT

Cette étude démontre que les modèles de fondation du single-cell Geneformer et scGPT intègrent une connaissance biologique organisée et hiérarchique révélée par des autoencodeurs clairsemés, mais qu'ils encodent une logique de régulation causale minimale face aux données de perturbation génomique.

Ihor Kendiukhov2026-03-04🧬 q-bio

Leveraging Label Proportion Prior for Class-Imbalanced Semi-Supervised Learning

Cet article propose un cadre léger intégrant une nouvelle fonction de perte de proportion, issue de l'apprentissage à partir de proportions d'étiquettes, pour atténuer les biais de classe dans l'apprentissage semi-supervisé déséquilibré et améliorer significativement les performances sur des benchmarks comme CIFAR-10 à longue traîne.

Kohki Akiba, Shinnosuke Matsuo, Shota Harada + 1 more2026-03-04🤖 cs.LG

Integrating Homomorphic Encryption and Synthetic Data in FL for Privacy and Learning Quality

Ce papier présente Alt-FL, une approche de fédéré learning qui alterne entre l'entraînement sur des données authentiques et synthétiques pour améliorer la précision du modèle tout en réduisant les coûts de chiffrement homomorphe et en garantissant une protection robuste de la vie privée.

Yenan Wang, Carla Fabiana Chiasserini, Elad Michael Schiller2026-03-04🤖 cs.LG

LAGO: A Local-Global Optimization Framework Combining Trust Region Methods and Bayesian Optimization

Le papier présente LAGO, un cadre d'optimisation combinant l'optimisation bayésienne améliorée par le gradient et des méthodes de région de confiance locales via un mécanisme de compétition adaptatif, permettant d'explorer efficacement l'espace de conception tout en assurant une convergence rapide dans les régions prometteuses.

Eliott Van Dieren, Tommaso Vanzan, Fabio Nobile2026-03-04🤖 cs.LG

On the Topology of Neural Network Superlevel Sets

Cet article démontre que les réseaux de neurones dont les activations satisfont une condition d'équation différentielle de type Riccati génèrent des sorties pfaffiennes, permettant d'établir des bornes uniformes dépendant uniquement de l'architecture sur la complexité topologique de leurs ensembles de sur-niveau et des lieux de chute du rang des crochets de Lie.

Bahman Gharesifard2026-03-04🤖 cs.LG

Variance reduction in lattice QCD observables via normalizing flows

Cet article présente l'application des flux normalisants pour réduire considérablement la variance des observables en QCD sur réseau, notamment pour les fonctions de corrélation de glueballs et les éléments de matrice gluoniques, tout en démontrant que cette efficacité est indépendante du volume du réseau, permettant ainsi d'optimiser les coûts de calcul.

Ryan Abbott, Denis Boyda, Yang Fu + 5 more2026-03-04⚛️ hep-lat

Why Does RLAIF Work At All?

Cet article propose l'hypothèse des valeurs latentes, selon laquelle le préentraînement encode les valeurs humaines dans l'espace de représentation et que les prompts constitutionnels les projettent pour expliquer le fonctionnement, les limites et les risques de l'apprentissage par renforcement à partir de feedbacks d'IA (RLAIF).

Robin Young2026-03-04🤖 cs.AI

Breaking the Prototype Bias Loop: Confidence-Aware Federated Contrastive Learning for Highly Imbalanced Clients

Cet article propose CAFedCL, un cadre d'apprentissage contrastif fédéré qui brise le biais des prototypes dans les environnements déséquilibrés grâce à une agrégation consciente de la confiance, à une augmentation générative et à une régularisation géométrique, garantissant ainsi une meilleure précision et équité.

Tian-Shuang Wu, Shen-Huan Lyu, Ning Chen + 4 more2026-03-04🤖 cs.LG

SEHFS: Structural Entropy-Guided High-Order Correlation Learning for Multi-View Multi-Label Feature Selection

Cet article propose SEHFS, une nouvelle méthode de sélection de caractéristiques pour l'apprentissage multi-vues multi-étiquettes qui utilise l'entropie structurelle pour capturer des corrélations d'ordre supérieur et un cadre hybride théorie de l'information-matrice pour éviter les optima locaux, surpassant ainsi les méthodes existantes sur plusieurs jeux de données.

Cheng Peng, Yonghao Li, Wanfu Gao + 2 more2026-03-04🤖 cs.LG

Step-Level Sparse Autoencoder for Reasoning Process Interpretation

Cet article propose un autoencodeur épars au niveau des étapes (SSAE) pour interpréter les processus de raisonnement des grands modèles de langage en décomposant les étapes de raisonnement en caractéristiques éparses, permettant ainsi de prédire des propriétés complexes comme la validité logique et d'éclairer les mécanismes d'auto-vérification de ces modèles.

Xuan Yang, Jiayu Liu, Yuhang Lai + 3 more2026-03-04🤖 cs.LG

Generalized Bayes for Causal Inference

Cet article propose un cadre bayésien généralisé pour l'inférence causale qui évite la modélisation explicite de la vraisemblance en plaçant directement des priors sur les estimands causaux et en les mettant à jour via une fonction de perte, permettant ainsi d'obtenir des incertitudes calibrées et robustes pour divers estimateurs d'apprentissage automatique causal.

Emil Javurek, Dennis Frauen, Yuxin Wang + 1 more2026-03-04📊 stat

← Précédent Suivant →