cs.LG artículos | Gist.Science

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este trabajo presenta un marco matemático unificado que demuestra la equivalencia entre el modelo generativo "Drifting" y el flujo de gradiente de Wasserstein de la divergencia KL bajo aproximación KDE, extendiendo este enfoque a otras divergencias, variedades riemannianas y estrategias mixtas para mitigar simultáneamente el colapso y el desenfoque de modos.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Este documento técnico presenta una implementación en JAX de la familia Broyden autoescalada de métodos cuasi-Newton, compatible con la librería Optimistix, que incluye variantes como BFGS, DFP y Broyden junto con una búsqueda de línea Zoom, con el objetivo de facilitar su adopción en la comunidad de JAX.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

El artículo presenta Geo-ATBench, un nuevo conjunto de datos y marco de referencia para la etiquetado de audio geoespacial que demuestra cómo integrar el contexto semántico geográfico mejora la precisión en la identificación de eventos sonoros, especialmente cuando la información acústica por sí sola es ambigua.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

El artículo propone la Recompensa de Expectativa Condicional (CER), un método que utiliza el propio modelo de lenguaje como verificador implícito para proporcionar señales de recompensa graduales y eliminar la dependencia de reglas de verificación manuales, mejorando así el aprendizaje por refuerzo en dominios de razonamiento generales y matemáticos.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Este artículo presenta un enfoque novedoso y explicable para detectar y eliminar backdoors en redes neuronales mediante el análisis de caminos activos, demostrando su eficacia experimental en un modelo de detección de intrusiones.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

El artículo presenta FAME, un nuevo método de explicaciones abductivas basado en interpretación abstracta que escala a redes neuronales grandes reduciendo el tamaño de las explicaciones mediante dominios de perturbación dedicados y límites LiRPA, superando a VERIX+ en eficiencia y calidad.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Este artículo presenta una red neuronal de grafos con atención espacio-temporal (STA-GNN) para la detección de anomalías no supervisada y explicable en sistemas de control industrial, la cual modela las interdependencias ciberfísicas, gestiona el desplazamiento de la línea base mediante predicción conformal y ofrece mecanismos de atención para revelar las relaciones causales detrás de las alertas.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Este trabajo presenta un marco de aprendizaje automático basado en redes neuronales SHRED y reducción de dimensionalidad mediante SVD para reconstruir de manera eficiente y precisa los estados completos de flujo magnetohidrodinámico en sistemas de fusión nuclear a partir de mediciones térmicas limitadas, demostrando su potencial como modelo sustituto para la estimación de estados en tiempo real.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

El artículo presenta "Contract And Conquer" (CAC), un método de ataque adversarial en caja negra que garantiza la generación de ejemplos adversarios para modelos de redes neuronales mediante la destilación de conocimiento y la contracción del espacio de búsqueda, superando a los métodos actuales en el conjunto de datos ImageNet.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

El artículo presenta EvoSchema, un nuevo benchmark que evalúa y mejora la robustez de los sistemas de texto-a-SQL frente a la evolución de esquemas de bases de datos mediante una taxonomía de perturbaciones que revela el impacto crítico de los cambios a nivel de tabla y demuestra que el entrenamiento con datos perturbados genera modelos más resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

El artículo presenta Riemannian MeanFlow (RMF), un método que extiende MeanFlow a variedades riemannianas mediante un campo de velocidades promedio y transporte paralelo para permitir la generación en un solo paso sin necesidad de integrar ecuaciones diferenciales, logrando así una reducción significativa en el costo de muestreo manteniendo alta calidad.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Este artículo presenta el algoritmo "Sample-and-Search", un método de aprendizaje aumentado para el problema de clustering $k$ -medianas en altas dimensiones que, mediante una técnica de muestreo, reduce significativamente la complejidad computacional y la dependencia exponencial de la dimensión en comparación con enfoques existentes.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

El sistema CacheSolidarity protege los entornos de inferencia de LLMs multi-tenant contra canales laterales de tiempo derivados de la caché de prefijos, logrando un equilibrio entre seguridad y eficiencia al aislar selectivamente solo los prefijos sospechosos en lugar de desactivar completamente el uso compartido de caché.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artículo compara la aproximación bayesiana mediante Dropout de Monte Carlo y el marco de Predicción Conformal para la estimación de incertidumbre en redes neuronales convolucionales, demostrando que, aunque algunos modelos logran mayor precisión, la evaluación de la calibración y la validez estadística es fundamental para desarrollar sistemas de aprendizaje profundo más fiables y seguros.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Este artículo propone una solución estructural a los fallos de filtrado de datos en el aprendizaje automático mediante una gramática basada en un grafo acíclico dirigido con siete primitivas y cuatro restricciones estrictas que, al imponer una frontera de evaluación en tiempo de ejecución, previenen la selección y la memorización de datos de prueba, validando su eficacia mediante múltiples implementaciones y estudios cuantitativos.

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

El artículo presenta CUPID, un marco de trabajo modular que estima de forma conjunta la incertidumbre aleatoria y epistémica en redes neuronales preentrenadas sin necesidad de reentrenamiento, ofreciendo una solución interpretable y adaptable para la toma de decisiones en entornos de alto riesgo.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

El artículo presenta DeepRDFC, un marco de aprendizaje profundo basado en autoencoders que optimiza la simulación de canales distribuidos para la computación de funciones aleatorizadas, logrando un rendimiento superior y una mayor eficiencia en la carga de comunicación en comparación con los métodos tradicionales de compresión de datos.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

El artículo presenta un método basado en Funciones Físicas No Clonables (PUF) para vincular los pesos de los modelos de redes neuronales a su hardware subyacente, impidiendo así la ejecución precisa de estos modelos en hardware clonado y protegiendo la propiedad intelectual.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

El artículo propone Sign-Prioritized FL (SP-FL), un marco innovador para el aprendizaje federado inalámbrico que mejora la fiabilidad y la precisión de los modelos priorizando la transmisión de los signos de los gradientes mediante una asignación jerárquica de recursos, logrando hasta un 9,96% más de exactitud en escenarios con recursos limitados.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Este trabajo propone un marco de aprendizaje profundo impulsado por la dinámica que combina precursores basados en la inestabilidad transitoria, calculados eficientemente mediante modos OTD, con modelos Transformer para extender significativamente el horizonte de predicción de eventos extremos en sistemas caóticos de alta dimensión sin requerir las ecuaciones gobernantes.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

← Anterior Siguiente →