Improving clustering quality evaluation in noisy Gaussian mixtures

El artículo presenta el método de Reescalado de Importancia de Características (FIR), una técnica teóricamente fundamentada que mejora la evaluación de la calidad del agrupamiento en mezclas gaussianas ruidosas al ajustar las contribuciones de las características según su dispersión, lo que aumenta la correlación entre los índices de validez y la verdad fundamental incluso en entornos con características irrelevantes o alto ruido.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Este artículo propone un marco de evaluación de clasificación binaria basado en la teoría de la decisión y el uso de reglas de puntuación propias como la puntuación Brier, respaldado por una herramienta práctica en Python y una variante técnica mejorada, para superar la dependencia actual de métricas de umbral fijo en la literatura de aprendizaje automático.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Este artículo presenta dos nuevos algoritmos de aprendizaje por refuerzo sin modelo, Q-EarlySettled-LowCost y FedQ-EarlySettled-LowCost, que logran simultáneamente un arrepentimiento casi óptimo, costos de inicio lineales en el número de estados y acciones, y costos de cambio de política o comunicación logarítmicos para entornos de agente único y federados.

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Este artículo establece por primera vez garantías de convergencia global lineal para un algoritmo de Mínimos Cuadrados Ponderados Iterativamente (IRLS) con regularización dinámica en la recuperación robusta de subespacios, extendiendo estos resultados teóricos a la estimación de subespacios afines y demostrando su utilidad práctica en el entrenamiento de redes neuronales.

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

El artículo presenta AffPCL, un marco de aprendizaje colaborativo personalizado que utiliza mecanismos de corrección de sesgo e importancia para lograr una reducción adaptativa de la complejidad de muestreo en entornos heterogéneos, interpolando automáticamente entre la aceleración lineal y el aprendizaje independiente sin requerir conocimiento previo de la heterogeneidad del sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Robust Assortment Optimization from Observational Data

Este trabajo propone un marco robusto para la optimización de surtidos basado en datos observacionales que maximiza los ingresos esperados en el peor de los casos ante cambios en las preferencias de los clientes, estableciendo garantías teóricas sobre la complejidad de la muestra y definiendo la "cobertura robusta por artículo" como el requisito mínimo de datos para un aprendizaje eficiente.

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose BlanchetWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Este trabajo estudia los procesos de decisión de Markov robustos no rectangulares bajo el criterio de recompensa promedio, demostrando que las políticas óptimas pueden caracterizarse mediante una representación minimax sin necesidad de rectangularidad, estableciendo la existencia de tales políticas bajo una suposición de comunicación débil e introduciendo un marco de valor transitorio que revela cómo la optimalidad en recompensa promedio puede ocultar un rendimiento temporal deficiente, lo que lleva a la construcción de una política basada en épocas que logra un valor transitorio de orden constante.

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabajo presenta un marco de redes neuronales informadas por física (PINN) que logra una estimación robusta de parámetros biofísicos y la reconstrucción de estados ocultos en modelos neuronales multiescala, superando las limitaciones de los métodos tradicionales al requerir solo observaciones parciales de voltaje y funcionar eficazmente incluso con estimaciones iniciales no informativas.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este trabajo presenta el modelo VI 2D SSM, una arquitectura de espacio de estados bidimensional que garantiza la equivarianza a la permutación en series temporales multivariantes mediante una descomposición teórica en dinámicas locales e interacciones globales, eliminando dependencias secuenciales innecesarias y logrando un rendimiento superior en diversas tareas de predicción y clasificación.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Multi-level meta-reinforcement learning with skill-based curriculum

Este trabajo propone un marco de aprendizaje por refuerzo meta-multinivel que combina la compresión eficiente de procesos de decisión de Markov mediante jerarquías de habilidades con un aprendizaje curricular, logrando así reducir la complejidad de la búsqueda de políticas, facilitar la transferencia de habilidades entre tareas y niveles, y garantizar la consistencia teórica bajo suposiciones moderadas.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Este artículo presenta un marco ablativo integral para la predicción selectiva que introduce el método de apuestas informado por transferencia (TIB) para mejorar la cuantificación de incertidumbre en entornos con escasez de datos mediante el uso de perfiles de riesgo de dominios fuente, demostrando superioridad teórica y empírica sobre nueve familias de cotas existentes en múltiples benchmarks.

Abhinaba BasuWed, 11 Ma🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

El artículo presenta ULFS-KDPE, un estimador de plug-in sesgado basado en un modelo desfavorable universal dentro de un espacio de Hilbert de núcleo reproductor (RKHS), que permite estimar parámetros diferenciables en modelos no paramétricos alcanzando la eficiencia semiparamétrica sin necesidad de derivar ni evaluar explícitamente las funciones de influencia eficiente.

Haiyi Chen, Yang Liu, Ivana MalenicaWed, 11 Ma🤖 cs.LG