cs.LG artículos | Gist.Science

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

El artículo presenta DT-BEHRT, un modelo basado en transformadores que mejora la representación de pacientes mediante el aprendizaje de trayectorias de enfermedades específicas por órganos y un preentrenamiento semántico, logrando así un alto rendimiento predictivo y una mayor interpretabilidad clínica en los registros electrónicos de salud.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Este artículo presenta un marco teórico unificado basado en el descenso de espejo estocástico regularizado que garantiza la estabilidad necesaria para inferencias estadísticas válidas en datos de bandaits adaptativos, ofreciendo simultáneamente garantías óptimas de arrepentimiento y robustez frente a corrupciones adversarias.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

El artículo presenta ARCHE, un marco de compresión de imágenes aprendido de extremo a extremo que equilibra precisión y eficiencia computacional mediante un diseño convolucional unificado, logrando una eficiencia tasa-distorsión superior a los codecs tradicionales y modelos autoregresivos existentes sin depender de componentes recurrentes o basados en transformadores.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

El artículo presenta la Cancelación Adaptativa de Activaciones (AAC), un marco de inferencia en tiempo real que mitiga las alucinaciones en modelos de lenguaje grandes suprimiendo selectivamente las activaciones neuronales asociadas a errores fácticos sin requerir ajuste fino ni degradar la capacidad general del modelo.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Este artículo propone el método de Promedio Dual Acelerado por Actor (Actor-Accelerated PDA), que utiliza una red neuronal para aproximar la selección de acciones en espacios continuos, logrando así una ejecución más rápida y un rendimiento superior al de PPO sin sacrificar las garantías teóricas de convergencia.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Este artículo propone un modelo híbrido de Markov oculto que combina estados de mercado discretos definidos por cuantiles Laplace con un mecanismo de saltos de Poisson para generar series temporales financieras sintéticas que superan a los modelos existentes al preservar simultáneamente distribuciones de colas pesadas, agrupación de volatilidad y estructuras temporales realistas.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Este artículo presenta el Aprendizaje de Corte Flexible (FCL), un método que entrena potenciales interatómicos de aprendizaje automático con radios de corte ajustables después del entrenamiento, permitiendo optimizar el equilibrio entre precisión y costo computacional para aplicaciones específicas sin necesidad de reentrenar el modelo.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

FusionNet: a frame interpolation network for 4D heart models

El artículo presenta FusionNet, una red neuronal que mejora la resolución temporal de las imágenes de resonancia magnética cardíaca mediante la interpolación de marcos para generar modelos cardíacos 4D precisos y reducir el tiempo de exploración.

Chujie Chang, Shoko Miyauchi, Ken'ichi Morooka, Ryo Kurazume, Oscar Martinez Mozos2026-03-12🤖 cs.LG

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

El artículo presenta SDSR, un método escalable basado en la teoría espectral de grafos que utiliza un enfoque de dividir y conquistar para reconstruir árboles filogenéticos de especies, logrando una reducción significativa en el tiempo de ejecución sin comprometer la precisión en comparación con los métodos tradicionales aplicados a datos completos.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Este artículo estudia una aproximación por difusión de tiempo continuo del gradiente de política para banditos estocásticos, demostrando que con una tasa de aprendizaje adecuada se logra un arrepentimiento logarítmico, mientras que se construye un caso donde una tasa inadecuada conduce a un arrepentimiento lineal.

Tor Lattimore2026-03-12📊 stat

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Este artículo propone y evalúa una extensión de la pérdida armónica mediante el uso de diversas métricas de distancia no euclidianas, demostrando que, especialmente la distancia coseno, mejora el rendimiento, la interpretabilidad y la sostenibilidad en modelos de visión y lenguaje en comparación con la pérdida de entropía cruzada tradicional.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artículo propone un método de programación cuadrática secuencial estocástica con región de confianza y punto interior (TR-IP-SSQP) para resolver problemas de optimización con función objetivo estocástica y restricciones deterministas, demostrando su convergencia casi segura y su rendimiento práctico mediante pruebas en conjuntos de datos estándar y regresión logística.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

El artículo presenta I2X, un marco que transforma la interpretabilidad no estructurada en explicaciones estructuradas para revelar el proceso de inferencia de modelos de clasificación de imágenes y, al mismo tiempo, mejorar su precisión mediante la identificación y el ajuste dirigido de prototipos inciertos.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

El artículo presenta "One-A", un marco unificado para el aprendizaje incremental de clases que aborda el desequilibrio entre tareas mediante una fusión asimétrica de adaptadores, logrando un rendimiento competitivo con un coste de inferencia constante.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Este estudio demuestra que un algoritmo neuromórfico nativamente espigante para resolver ecuaciones diferenciales parciales posee una robustez intrínseca y tolerancia a fallos, manteniendo su precisión incluso con la eliminación de hasta el 32% de las neuronas y el 90% de las espigas, gracias a su inspiración cerebral.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

El artículo presenta SiMPO, un marco unificado para el aprendizaje por refuerzo con políticas de difusión que generaliza los esquemas de reponderación mediante la coincidencia de medidas firmadas, permitiendo el uso de funciones de ponderación arbitrarias y la reponderación negativa para evitar acciones subóptimas y mejorar el rendimiento.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artículo demuestra que, cuando la distribución previa condicional a los hiperparámetros es una distribución canónica de máxima entropía, la distribución marginal dependiente resultante también posee una propiedad de máxima entropía bajo una restricción diferente sobre la distribución marginal de una función de las cantidades desconocidas, aclarando así la información asumida al asignar un modelo jerárquico bayesiano.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Este trabajo mejora la generación de datos tabulares sintéticos del modelo TabPFN integrando la estructura causal mediante condicionamiento basado en grafos acíclicos dirigidos (DAG) y grafos acíclicos dirigidos parcialmente completados (CPDAG), lo que elimina correlaciones espurias y preserva los efectos causales al alinear el orden de generación con las relaciones causales reales.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Este artículo presenta el descubrimiento y la extracción de un algoritmo compacto y de alto rendimiento para el análisis hematopoyético a partir del modelo fundacional scGPT mediante interpretabilidad mecánica, logrando resultados superiores a métodos existentes con una eficiencia computacional y de parámetros significativamente mayor.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

El artículo presenta DICE-RL, un marco de aprendizaje por refuerzo que refina políticas generativas preentrenadas mediante una contracción de distribución para lograr un dominio eficiente y estable de habilidades de manipulación robótica complejas tanto en simulación como en robots reales.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

← Anterior Siguiente →