Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

El artículo presenta un marco de aprendizaje de operadores no locales basado en kernels de integración impulsados por datos que separan la agregación de información no local de la predicción no lineal local, logrando modelos interpretables y eficientes para la precipitación del monzón asiático con menos parámetros y mayor claridad física.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este trabajo aborda el problema de identificación del mejor brazo en banditos lineales no estacionarios estableciendo un límite inferior dependiente del conjunto de brazos y proponiendo el algoritmo Adjacent-BAI\textsf{Adjacent-BAI}, que logra una probabilidad de error óptima al aprovechar la estructura geométrica del conjunto de brazos.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

El artículo presenta HEAL, un marco de aprendizaje sin refuerzo que supera las limitaciones del destilado tradicional mediante la integración de reparación asistida por entropía, estimación de incertidumbre y un currículo evolutivo progresivo para transferir eficazmente capacidades de razonamiento de modelos grandes a modelos más pequeños.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artículo analiza la dinámica de aprendizaje de redes lineales de dos capas entrenadas con SGD y ruido en las etiquetas, revelando un comportamiento bifásico donde el ruido impulsa la transición de un régimen "perezoso" a uno "rico" para mejorar la generalización, un hallazgo que también se extiende a algoritmos como SAM y se valida mediante experimentos exhaustivos.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

El artículo presenta STemDist, el primer método de destilación de datos diseñado específicamente para la predicción espacio-temporal, que comprime de manera equilibrada las dimensiones espaciales y temporales a nivel de clúster y mediante granularidad de subconjuntos, logrando entrenamientos hasta 6 veces más rápidos, 8 veces más eficientes en memoria y con un error de predicción hasta un 12% menor en comparación con métodos existentes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Este artículo presenta un marco de aprendizaje de indicadores de salud adaptativo al dominio que combina un muestreo de lotes sincronizado por etapas de degradación y un autoencoder de fusión alineada entre dominios con mecanismos de atención cruzada para superar las discrepancias de distribución y las limitaciones estructurales en la modelado de señales de vibración complejas, logrando un rendimiento superior en sistemas de defensa y rodamientos industriales.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

GGMPs: Generalized Gaussian Mixture Processes

El artículo presenta los Procesos de Mezcla Gaussiana Generalizada (GGMP), un método basado en procesos gaussianos que permite la estimación de densidades condicionales multimodales y heterocedásticas mediante una combinación de ajuste local, alineación de componentes y entrenamiento por componente, ofreciendo una solución tratable y escalable para datos no gaussianos complejos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. Noack2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

El artículo demuestra que la eliminación de un sesgo de media coherente de rango uno, principal causante de la inestabilidad numérica en el entrenamiento de modelos de lenguaje con cuantización FP4, permite recuperar la estabilidad y el rendimiento cercanos a BF16 mediante una operación simple y eficiente en hardware.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models

Este artículo presenta un método de olvido de instancias sin prompts para modelos de difusión que, mediante un enfoque basado en sustitutos, edición de imágenes y cirugía de gradientes, permite eliminar selectivamente salidas indeseadas e inexpresables mediante texto (como rostros específicos o representaciones culturalmente inexactas) mientras preserva la integridad del modelo.

Kyungryeol Lee, Kyeonghyun Lee, Seongmin Hong, Byung Hyun Lee, Se Young Chun2026-03-12🤖 cs.LG

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

Este estudio propone un marco de conjunto basado en ConvLSTM multi-resolución que, al integrar diversas resoluciones temporales de entrada, mitiga la acumulación de errores y mejora la precisión en la predicción a largo plazo de la deformación de muros de contención durante excavaciones escalonadas.

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG