Fréchet regression of multivariate distributions with nonparanormal transport

Este trabajo propone un nuevo enfoque de regresión Fréchet para respuestas de distribuciones multivariadas basado en la familia semiparamétrica no paranoormal y la métrica de transporte no paranoormal, la cual descompone el problema en regresiones marginales y de dependencia para lograr una estimación eficiente, interpretaciones granulares y garantías de convergencia que mitigan la maldición de la dimensionalidad.

Junyoung Park, Irina GaynanovaTue, 10 Ma🔢 math

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

Este artículo propone DualAdam, un optimizador que combina los mecanismos de actualización de Adam y su variante inversa (InvAdam) para garantizar la convergencia mientras mejora la generalización al ayudar a los modelos a escapar de mínimos agudos y encontrar mínimos planos, lo cual se valida mediante teoría de difusión y experimentos en clasificación de imágenes y ajuste fino de modelos de lenguaje grande.

Tao Shi, Liangming Chen, Long Jin, Mengchu ZhouTue, 10 Ma🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Este artículo presenta MSKernelBench, un nuevo estándar de evaluación para múltiples escenarios, y CUDAMaster, un sistema multiagente que optimiza automáticamente kernels CUDA en diversos dominios (desde operaciones algebraicas hasta computación científica), logrando aceleraciones significativas que superan a métodos existentes y rivalizan con bibliotecas de alto rendimiento como cuBLAS.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min HuTue, 10 Ma🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Este artículo propone y valida un método mejorado de regresión rango-rango condicional (CRRR) mediante modelos de transformación condicional profundos (DCTM) y cross-fitting para estimar la movilidad intergeneracional con mayor precisión en escenarios no lineales y con resultados discretos, demostrando su eficacia tanto en simulaciones como en aplicaciones empíricas sobre ingresos en EE. UU. y movilidad educativa en la India.

Xiaoyi Wang, Long Feng, Zhaojun WangTue, 10 Ma🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

El artículo presenta los Mapas de Flujo Variacionales (VFMs), un marco que permite la generación condicional de imágenes de alta calidad en un solo paso mediante el aprendizaje de una distribución de ruido inicial adaptada a la observación, superando así las limitaciones de los modelos iterativos tradicionales.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius BernerTue, 10 Ma🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este trabajo presenta garantías finitas de muestra para aprender representaciones de estado impulsadas por costos y controladores subóptimos en sistemas de control lineal cuadrático gaussiano (LQG) de horizonte infinito, abordando tanto modelos de dinámica latente explícitos como implícitos (similares a MuZero) y estableciendo una nueva contribución técnica sobre la excitación persistente en procesos estocásticos.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Este artículo introduce un marco teórico basado en el filtrado de partículas para analizar rigurosamente los métodos de inferencia paralela en modelos de lenguaje, identificando garantías no asintóticas, mejoras algorítmicas y límites fundamentales, aunque sus hallazgos empíricos sugieren que la precisión final depende de factores más allá del error de muestreo.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay KrishnamurthyTue, 10 Ma🤖 cs.LG

Amortizing Maximum Inner Product Search with Learned Support Functions

Este artículo propone un enfoque de búsqueda de producto interno máximo (MIPS) amortizado que utiliza redes neuronales, específicamente SupportNet y KeyNet, para predecir directamente los vectores óptimos aprovechando las propiedades matemáticas de las funciones de soporte, lo que reduce significativamente los costos computacionales para distribuciones de consultas fijas.

Theo X. Olausson, João Monteiro, Michal Klein, Marco CuturiTue, 10 Ma🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Este artículo presenta un método novedoso de monitoreo de condiciones basado en la detección probabilística de anomalías utilizando únicamente datos saludables, el cual incorpora cuantificación de incertidumbre y herramientas explicativas para la toma de decisiones en aplicaciones críticas, validándose con éxito en un conjunto de datos de transmisiones de helicópteros y un benchmark público.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara TanelliTue, 10 Ma🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Este artículo critica el enfoque actual de la predicción de series temporales a largo plazo, que prioriza la reducción marginal de métricas de error puntuales en tablas de clasificación, y propone una evaluación multidimensional que integre la fidelidad estadística, la coherencia estructural y la relevancia para la toma de decisiones para alinear el progreso de la investigación con los objetivos reales de la predicción.

Thanapol Phungtua-eng, Yoshitaka YamamotoTue, 10 Ma🤖 cs.LG