Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este trabajo presenta un marco matemático unificado que demuestra la equivalencia entre el modelo generativo "Drifting" y el flujo de gradiente de Wasserstein de la divergencia KL bajo aproximación KDE, extendiendo este enfoque a otras divergencias, variedades riemannianas y estrategias mixtas para mitigar simultáneamente el colapso y el desenfoque de modos.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

El artículo presenta Geo-ATBench, un nuevo conjunto de datos y marco de referencia para la etiquetado de audio geoespacial que demuestra cómo integrar el contexto semántico geográfico mejora la precisión en la identificación de eventos sonoros, especialmente cuando la información acústica por sí sola es ambigua.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Este artículo presenta una red neuronal de grafos con atención espacio-temporal (STA-GNN) para la detección de anomalías no supervisada y explicable en sistemas de control industrial, la cual modela las interdependencias ciberfísicas, gestiona el desplazamiento de la línea base mediante predicción conformal y ofrece mecanismos de atención para revelar las relaciones causales detrás de las alertas.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Este trabajo presenta un marco de aprendizaje automático basado en redes neuronales SHRED y reducción de dimensionalidad mediante SVD para reconstruir de manera eficiente y precisa los estados completos de flujo magnetohidrodinámico en sistemas de fusión nuclear a partir de mediciones térmicas limitadas, demostrando su potencial como modelo sustituto para la estimación de estados en tiempo real.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

El artículo presenta EvoSchema, un nuevo benchmark que evalúa y mejora la robustez de los sistemas de texto-a-SQL frente a la evolución de esquemas de bases de datos mediante una taxonomía de perturbaciones que revela el impacto crítico de los cambios a nivel de tabla y demuestra que el entrenamiento con datos perturbados genera modelos más resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

El artículo presenta Riemannian MeanFlow (RMF), un método que extiende MeanFlow a variedades riemannianas mediante un campo de velocidades promedio y transporte paralelo para permitir la generación en un solo paso sin necesidad de integrar ecuaciones diferenciales, logrando así una reducción significativa en el costo de muestreo manteniendo alta calidad.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Este artículo presenta el algoritmo "Sample-and-Search", un método de aprendizaje aumentado para el problema de clustering kk-medianas en altas dimensiones que, mediante una técnica de muestreo, reduce significativamente la complejidad computacional y la dependencia exponencial de la dimensión en comparación con enfoques existentes.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

El sistema CacheSolidarity protege los entornos de inferencia de LLMs multi-tenant contra canales laterales de tiempo derivados de la caché de prefijos, logrando un equilibrio entre seguridad y eficiencia al aislar selectivamente solo los prefijos sospechosos en lugar de desactivar completamente el uso compartido de caché.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artículo compara la aproximación bayesiana mediante Dropout de Monte Carlo y el marco de Predicción Conformal para la estimación de incertidumbre en redes neuronales convolucionales, demostrando que, aunque algunos modelos logran mayor precisión, la evaluación de la calibración y la validez estadística es fundamental para desarrollar sistemas de aprendizaje profundo más fiables y seguros.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Este artículo propone una solución estructural a los fallos de filtrado de datos en el aprendizaje automático mediante una gramática basada en un grafo acíclico dirigido con siete primitivas y cuatro restricciones estrictas que, al imponer una frontera de evaluación en tiempo de ejecución, previenen la selección y la memorización de datos de prueba, validando su eficacia mediante múltiples implementaciones y estudios cuantitativos.

Simon Roth2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

El artículo propone Sign-Prioritized FL (SP-FL), un marco innovador para el aprendizaje federado inalámbrico que mejora la fiabilidad y la precisión de los modelos priorizando la transmisión de los signos de los gradientes mediante una asignación jerárquica de recursos, logrando hasta un 9,96% más de exactitud en escenarios con recursos limitados.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Este trabajo propone un marco de aprendizaje profundo impulsado por la dinámica que combina precursores basados en la inestabilidad transitoria, calculados eficientemente mediante modos OTD, con modelos Transformer para extender significativamente el horizonte de predicción de eventos extremos en sistemas caóticos de alta dimensión sin requerir las ecuaciones gobernantes.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin