DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

El artículo presenta DT-BEHRT, un modelo basado en transformadores que mejora la representación de pacientes mediante el aprendizaje de trayectorias de enfermedades específicas por órganos y un preentrenamiento semántico, logrando así un alto rendimiento predictivo y una mayor interpretabilidad clínica en los registros electrónicos de salud.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Este artículo presenta un marco teórico unificado basado en el descenso de espejo estocástico regularizado que garantiza la estabilidad necesaria para inferencias estadísticas válidas en datos de bandaits adaptativos, ofreciendo simultáneamente garantías óptimas de arrepentimiento y robustez frente a corrupciones adversarias.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

El artículo presenta ARCHE, un marco de compresión de imágenes aprendido de extremo a extremo que equilibra precisión y eficiencia computacional mediante un diseño convolucional unificado, logrando una eficiencia tasa-distorsión superior a los codecs tradicionales y modelos autoregresivos existentes sin depender de componentes recurrentes o basados en transformadores.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

El artículo presenta la Cancelación Adaptativa de Activaciones (AAC), un marco de inferencia en tiempo real que mitiga las alucinaciones en modelos de lenguaje grandes suprimiendo selectivamente las activaciones neuronales asociadas a errores fácticos sin requerir ajuste fino ni degradar la capacidad general del modelo.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Este artículo propone un modelo híbrido de Markov oculto que combina estados de mercado discretos definidos por cuantiles Laplace con un mecanismo de saltos de Poisson para generar series temporales financieras sintéticas que superan a los modelos existentes al preservar simultáneamente distribuciones de colas pesadas, agrupación de volatilidad y estructuras temporales realistas.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Este artículo presenta el Aprendizaje de Corte Flexible (FCL), un método que entrena potenciales interatómicos de aprendizaje automático con radios de corte ajustables después del entrenamiento, permitiendo optimizar el equilibrio entre precisión y costo computacional para aplicaciones específicas sin necesidad de reentrenar el modelo.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

El artículo presenta SDSR, un método escalable basado en la teoría espectral de grafos que utiliza un enfoque de dividir y conquistar para reconstruir árboles filogenéticos de especies, logrando una reducción significativa en el tiempo de ejecución sin comprometer la precisión en comparación con los métodos tradicionales aplicados a datos completos.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Este artículo propone y evalúa una extensión de la pérdida armónica mediante el uso de diversas métricas de distancia no euclidianas, demostrando que, especialmente la distancia coseno, mejora el rendimiento, la interpretabilidad y la sostenibilidad en modelos de visión y lenguaje en comparación con la pérdida de entropía cruzada tradicional.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artículo propone un método de programación cuadrática secuencial estocástica con región de confianza y punto interior (TR-IP-SSQP) para resolver problemas de optimización con función objetivo estocástica y restricciones deterministas, demostrando su convergencia casi segura y su rendimiento práctico mediante pruebas en conjuntos de datos estándar y regresión logística.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artículo demuestra que, cuando la distribución previa condicional a los hiperparámetros es una distribución canónica de máxima entropía, la distribución marginal dependiente resultante también posee una propiedad de máxima entropía bajo una restricción diferente sobre la distribución marginal de una función de las cantidades desconocidas, aclarando así la información asumida al asignar un modelo jerárquico bayesiano.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Este trabajo mejora la generación de datos tabulares sintéticos del modelo TabPFN integrando la estructura causal mediante condicionamiento basado en grafos acíclicos dirigidos (DAG) y grafos acíclicos dirigidos parcialmente completados (CPDAG), lo que elimina correlaciones espurias y preserva los efectos causales al alinear el orden de generación con las relaciones causales reales.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Este artículo presenta el descubrimiento y la extracción de un algoritmo compacto y de alto rendimiento para el análisis hematopoyético a partir del modelo fundacional scGPT mediante interpretabilidad mecánica, logrando resultados superiores a métodos existentes con una eficiencia computacional y de parámetros significativamente mayor.

Ihor Kendiukhov2026-03-12🧬 q-bio