DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

L'article propose DT-BEHRT, un modèle de type Transformer enrichi par des graphes qui améliore la prédiction clinique et l'interprétabilité des dossiers médicaux électroniques en modélisant explicitement les trajectoires de maladies au sein des systèmes d'organes et en intégrant une préformation sémantique basée sur l'ontologie.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Ce papier établit un cadre théorique unifié reliant la stabilité des algorithmes de descente de miroir stochastique régularisée à une inférence statistique valide dans les bandits, démontrant que des variantes régularisées de l'algorithme EXP3 permettent d'obtenir simultanément des intervalles de confiance fiables, une régression minimax optimale et une robustesse aux corruptions adverses.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Ce papier présente l'Adaptive Activation Cancellation (AAC), un cadre d'inférence en temps réel qui atténue les hallucinations des grands modèles de langage en identifiant et en supprimant sélectivement les activations neuronales associées aux erreurs factuelles, améliorant ainsi la précision sans altérer la fluidité ni les capacités générales du modèle.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Cet article propose une méthode de « dual averaging » accélérée par un acteur pour l'apprentissage par renforcement dans des espaces d'actions continus, qui utilise un réseau de politiques pour approximer efficacement les sous-problèmes d'optimisation tout en conservant des garanties de convergence théoriques et surpassant des méthodes de référence comme PPO.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Cet article propose un modèle de Markov caché hybride combinant des états discrets définis par des quantiles de Laplace et un mécanisme de sauts de Poisson pour générer des séries temporelles financières synthétiques qui reproduisent simultanément avec une grande fidélité les distributions à queues lourdes, la structure temporelle et les effets de grappes de volatilité, surpassant ainsi les modèles GARCH et HMM standards sur l'ensemble des métriques de qualité.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Ce papier présente l'apprentissage de coupure flexible (FCL), une méthode permettant d'entraîner des potentiels interatomiques par apprentissage automatique avec des rayons de coupure ajustables après l'entraînement, offrant ainsi une optimisation post-formation du compromis précision-coût sans nécessiter de réentraînement.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

Ce papier présente SDSR, une méthode évolutive de reconstruction d'arbres d'espèces basée sur une approche spectrale diviser-pour-régner qui, tout en préservant la précision, réduit considérablement le temps de calcul par rapport aux méthodes existantes.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Ce papier propose d'étendre la perte harmonique au-delà de la géométrie euclidienne en évaluant systématiquement diverses métriques de distance sur des modèles de vision et de langage, démontrant que l'utilisation de distances cosinus améliore la précision, la stabilité et la durabilité environnementale par rapport à la perte par entropie croisée.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Cet article propose une méthode de programmation quadratique séquentielle stochastique à région de confiance et points intérieurs (TR-IP-SSQP) pour résoudre des problèmes d'optimisation avec une fonction objectif stochastique et des contraintes non linéaires déterministes, en établissant sa convergence globale presque sûre et en validant ses performances pratiques sur des benchmarks et des problèmes de régression logistique.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Ce papier propose d'améliorer la génération de données tabulaires synthétiques par TabPFN en intégrant des structures causales via un conditionnement orienté par des graphes acycliques dirigés (DAG) ou partiellement orientés (CPDAG), ce qui permet de corriger les corrélations spurious induites par l'ordre des caractéristiques et de mieux préserver les effets causaux.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Cette étude présente la première extraction d'un algorithme biologique compétitif et compact à partir du modèle fondamental scGPT, révélant une variété hématopoïétique interne qui, une fois isolée via une méthode d'interprétabilité mécanistique, surpasse les méthodes existantes en précision et en efficacité tout en nécessitant un nombre négligeable de paramètres à entraîner.

Ihor Kendiukhov2026-03-12🧬 q-bio