cs.LG articles | Gist.Science

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

L'article propose DT-BEHRT, un modèle de type Transformer enrichi par des graphes qui améliore la prédiction clinique et l'interprétabilité des dossiers médicaux électroniques en modélisant explicitement les trajectoires de maladies au sein des systèmes d'organes et en intégrant une préformation sémantique basée sur l'ontologie.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Ce papier établit un cadre théorique unifié reliant la stabilité des algorithmes de descente de miroir stochastique régularisée à une inférence statistique valide dans les bandits, démontrant que des variantes régularisées de l'algorithme EXP3 permettent d'obtenir simultanément des intervalles de confiance fiables, une régression minimax optimale et une robustesse aux corruptions adverses.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Le papier présente ARCHE, un cadre de compression d'images appris de bout en bout qui allie efficacité de modélisation et performance computationnelle en unifiant des priors hiérarchiques, spatiaux et canalaires sans recourir à des composants récurrents ou transformateurs, atteignant ainsi des résultats de l'état de l'art en taux-distorsion.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Ce papier présente l'Adaptive Activation Cancellation (AAC), un cadre d'inférence en temps réel qui atténue les hallucinations des grands modèles de langage en identifiant et en supprimant sélectivement les activations neuronales associées aux erreurs factuelles, améliorant ainsi la précision sans altérer la fluidité ni les capacités générales du modèle.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Cet article propose une méthode de « dual averaging » accélérée par un acteur pour l'apprentissage par renforcement dans des espaces d'actions continus, qui utilise un réseau de politiques pour approximer efficacement les sous-problèmes d'optimisation tout en conservant des garanties de convergence théoriques et surpassant des méthodes de référence comme PPO.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Cet article propose un modèle de Markov caché hybride combinant des états discrets définis par des quantiles de Laplace et un mécanisme de sauts de Poisson pour générer des séries temporelles financières synthétiques qui reproduisent simultanément avec une grande fidélité les distributions à queues lourdes, la structure temporelle et les effets de grappes de volatilité, surpassant ainsi les modèles GARCH et HMM standards sur l'ensemble des métriques de qualité.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Ce papier présente l'apprentissage de coupure flexible (FCL), une méthode permettant d'entraîner des potentiels interatomiques par apprentissage automatique avec des rayons de coupure ajustables après l'entraînement, offrant ainsi une optimisation post-formation du compromis précision-coût sans nécessiter de réentraînement.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

FusionNet: a frame interpolation network for 4D heart models

Ce papier présente FusionNet, un réseau de neurones conçu pour générer des modèles cardiaques 4D à haute résolution temporelle à partir d'images IRM cardiaques acquises rapidement, permettant ainsi de réduire la durée des examens tout en maintenant une précision diagnostique supérieure aux méthodes existantes.

Chujie Chang, Shoko Miyauchi, Ken'ichi Morooka, Ryo Kurazume, Oscar Martinez Mozos2026-03-12🤖 cs.LG

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

Ce papier présente SDSR, une méthode évolutive de reconstruction d'arbres d'espèces basée sur une approche spectrale diviser-pour-régner qui, tout en préservant la précision, réduit considérablement le temps de calcul par rapport aux méthodes existantes.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Cet article étudie une approximation par diffusion en temps continu des algorithmes de gradient de politique pour les bandits stochastiques à $k$ bras, démontrant que des taux de regret optimaux sont atteints avec un taux d'apprentissage spécifique, tout en établissant que des taux linéaires inévitables surviennent sans cette condition même pour un nombre logarithmique de bras.

Tor Lattimore2026-03-12📊 stat

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Ce papier propose d'étendre la perte harmonique au-delà de la géométrie euclidienne en évaluant systématiquement diverses métriques de distance sur des modèles de vision et de langage, démontrant que l'utilisation de distances cosinus améliore la précision, la stabilité et la durabilité environnementale par rapport à la perte par entropie croisée.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Cet article propose une méthode de programmation quadratique séquentielle stochastique à région de confiance et points intérieurs (TR-IP-SSQP) pour résoudre des problèmes d'optimisation avec une fonction objectif stochastique et des contraintes non linéaires déterministes, en établissant sa convergence globale presque sûre et en validant ses performances pratiques sur des benchmarks et des problèmes de régression logistique.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

Ce papier présente I2X, un cadre innovant qui transforme les interprétations non structurées en explications structurées pour révéler le processus de décision des modèles d'apprentissage profond et améliorer leur précision grâce à un ajustement ciblé.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

Ce papier propose One-A, un cadre unifié et conscient du déséquilibre pour l'apprentissage incrémental de classes, qui fusionne de manière asymétrique les mises à jour des tâches dans un seul adaptateur afin de maintenir la stabilité et la plasticité face à des flux de tâches de tailles variables.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Cette étude démontre qu'un algorithme neuromorphique nativement épiqué conçu pour résoudre des équations aux dérivées partielles possède une robustesse intrinsèque remarquable, tolérant jusqu'à 32 % de neurones et 90 % de spikes supprimés sans dégradation significative de la précision.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

Ce papier présente SiMPO, un cadre unifié pour l'apprentissage par renforcement en diffusion qui généralise les schémas de rééquilibrage via des fonctions monotones et introduit un concept de mesure signée pour repousser activement les actions sous-optimales, améliorant ainsi les performances par rapport aux méthodes existantes.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Cet article démontre que, lorsque la conditionnelle d'un modèle hiérarchique bayésien suit une distribution canonique de principe d'entropie maximale, la loi marginale dépendante qui en résulte conserve également une propriété d'entropie maximale sous une contrainte différente portant sur la distribution marginale d'une fonction des paramètres inconnus.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Ce papier propose d'améliorer la génération de données tabulaires synthétiques par TabPFN en intégrant des structures causales via un conditionnement orienté par des graphes acycliques dirigés (DAG) ou partiellement orientés (CPDAG), ce qui permet de corriger les corrélations spurious induites par l'ordre des caractéristiques et de mieux préserver les effets causaux.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Cette étude présente la première extraction d'un algorithme biologique compétitif et compact à partir du modèle fondamental scGPT, révélant une variété hématopoïétique interne qui, une fois isolée via une méthode d'interprétabilité mécanistique, surpasse les méthodes existantes en précision et en efficacité tout en nécessitant un nombre négligeable de paramètres à entraîner.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

Ce papier présente DICE-RL, un cadre d'apprentissage par renforcement qui affine efficacement des politiques robotiques préentraînées en contractant leur distribution vers des comportements à fort succès, permettant ainsi l'acquisition de compétences complexes de manipulation à partir d'entrées visuelles.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

← Précédent Suivant →