Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este trabajo presenta garantías finitas de muestra para aprender representaciones de estado impulsadas por costos y controladores subóptimos en sistemas de control lineal cuadrático gaussiano (LQG) de horizonte infinito, abordando tanto modelos de dinámica latente explícitos como implícitos (similares a MuZero) y estableciendo una nueva contribución técnica sobre la excitación persistente en procesos estocásticos.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

El artículo presenta Dial, un sistema de NL2SQL basado en conocimiento que aborda la heterogeneidad de los dialectos SQL mediante planificación lógica consciente del dialecto, una base de conocimiento jerárquica y un bucle de depuración, logrando mejoras significativas en precisión y cobertura de características en comparación con los métodos existentes.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Este trabajo presenta el Transformador de Doble Flujo, una arquitectura que descompone el flujo residual en dos componentes funcionales distintos para lograr un equilibrio ajustable entre la interpretabilidad y el rendimiento en modelos de lenguaje, demostrando que estrategias de mezcla como la de Kronecker permiten una comunicación eficiente entre cabezas de atención con una pérdida de rendimiento mínima.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

El artículo presenta AFTUNE, un marco auditable y verificable que garantiza la integridad computacional del ajuste fino y la inferencia de modelos grandes en la nube mediante un mecanismo ligero de registro y verificación por muestreo, permitiendo a los clientes auditar procesos propietarios sin incurrir en sobrecargas prohibitivas.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabajo propone un marco de adaptación ligero que, mediante el uso de adaptadores de bajo rango actualizados con aprendizaje auto-supervisado sobre una base congelada, mejora la robustez de los modelos de mejora de voz en entornos acústicos dinámicos con menos del 1% de parámetros actualizados y una rápida convergencia, facilitando su implementación en dispositivos.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

Este artículo propone un marco mejorado de proyecciones locales en subespacios aleatorios que, mediante técnicas como la agregación ponderada y el muestreo adaptativo, logra estimaciones de respuestas al impulso más estables y fiables en series temporales de alta dimensión, reduciendo significativamente la variabilidad del estimador y mejorando la inferencia estadística en comparación con los métodos tradicionales.

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

El artículo presenta BoT, el primer marco unificado y agnóstico al tamaño que trata el escalado bidireccional de modelos (de pequeño a grande y viceversa) como operaciones de procesamiento de señales mediante la Transformada Discreta de Wavelet, logrando ahorros significativos en FLOPs de pre-entrenamiento y rendimiento superior en diversos benchmarks.

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts

Este trabajo presenta OCLADS, un marco de comunicación con aprendizaje continuo que optimiza la detección de anomalías en dispositivos IoT mediante la selección inteligente de muestras y la detección de cambios de distribución en el servidor de borde, logrando alta precisión con menos actualizaciones de modelo en entornos no estacionarios.

Matea Marinova, Shashi Raj Pandey, Junya Shiraishi, Martin Voigt Vejling, Valentin Rakovic, Petar Popovski2026-03-10🤖 cs.LG

A Unified View of Drifting and Score-Based Models

Este artículo establece una conexión precisa entre los modelos de deriva y los basados en puntuación, demostrando que la deriva con núcleo gaussiano equivale a un objetivo de coincidencia de puntuaciones en distribuciones suavizadas y proporcionando un marco unificado que explica su relación con métodos como DMD y su validez en diversos regímenes.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

One-for-All Model Initialization with Frequency-Domain Knowledge

El artículo presenta FRONT, un marco novedoso que extrae el "learngene" (conocimiento fundamental) de modelos preentrenados mediante componentes de baja frecuencia en el dominio de la transformada discreta del coseno (DCT), permitiendo inicializar modelos de cualquier escala de forma libre de entrenamiento y logrando un rendimiento superior con una aceleración significativa en la convergencia y una reducción en los costos computacionales.

Jianlu Shen, Fu Feng, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

Este artículo presenta un marco preentrenado informado por dinámicas neuronales que supera a los métodos dominantes al construir redes funcionales cerebrales personalizadas y generalizables en escenarios heterogéneos, logrando una representación precisa de los patrones de actividad neural sin depender de atlas predefinidos o suposiciones lineales.

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG