stat.ML artículos | Gist.Science

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Este artículo presenta un marco de prognóstico no supervisado que identifica modos de fallo latentes y selecciona sensores informativos a partir de datos sin etiquetar para predecir con mayor precisión la vida útil restante en hábitats de espacio profundo autónomos.

Benjamin Peters, Ayush Mohanty, Xiaolei Fang, Stephen K. Robinson, Nagi GebraeelWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

El artículo presenta el método de Reescalado de Importancia de Características (FIR), una técnica teóricamente fundamentada que mejora la evaluación de la calidad del agrupamiento en mezclas gaussianas ruidosas al ajustar las contribuciones de las características según su dispersión, lo que aumenta la correlación entre los índices de validez y la verdad fundamental incluso en entornos con características irrelevantes o alto ruido.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Este artículo propone un marco de evaluación de clasificación binaria basado en la teoría de la decisión y el uso de reglas de puntuación propias como la puntuación Brier, respaldado por una herramienta práctica en Python y una variante técnica mejorada, para superar la dependencia actual de métricas de umbral fijo en la literatura de aprendizaje automático.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Este artículo presenta dos nuevos algoritmos de aprendizaje por refuerzo sin modelo, Q-EarlySettled-LowCost y FedQ-EarlySettled-LowCost, que logran simultáneamente un arrepentimiento casi óptimo, costos de inicio lineales en el número de estados y acciones, y costos de cambio de política o comunicación logarítmicos para entornos de agente único y federados.

Haochen Zhang, Zhong Zheng, Lingzhou XueWed, 11 Ma🤖 cs.LG

Uncovering Social Network Activity Using Joint User and Topic Interaction

Este artículo presenta el modelo MIC (Mixture of Interacting Cascades), basado en procesos puntuales de Hawkes multidimensionales, para capturar conjuntamente las interacciones entre usuarios y cascadas de información, demostrando un rendimiento superior en la modelización y visualización de la actividad en redes sociales.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-FurlingWed, 11 Ma🤖 cs.LG

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Este artículo establece por primera vez garantías de convergencia global lineal para un algoritmo de Mínimos Cuadrados Ponderados Iterativamente (IRLS) con regularización dinámica en la recuperación robusta de subespacios, extendiendo estos resultados teóricos a la estimación de subespacios afines y demostrando su utilidad práctica en el entrenamiento de redes neuronales.

Gilad Lerman, Kang Li, Tyler Maunu, Teng ZhangWed, 11 Ma🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Este artículo propone y evalúa métodos de Monte Carlo con nodos repulsivos para calcular la distancia de Wasserstein cortada, concluyendo que el estimador UnifOrtho es óptimo en altas dimensiones mientras que el cuasi-Monte Carlo aleatorizado es preferible en dimensiones bajas.

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

El artículo presenta AffPCL, un marco de aprendizaje colaborativo personalizado que utiliza mecanismos de corrección de sesgo e importancia para lograr una reducción adaptativa de la complejidad de muestreo en entornos heterogéneos, interpolando automáticamente entre la aceleración lineal y el aprendizaje independiente sin requerir conocimiento previo de la heterogeneidad del sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Este artículo presenta la modelización generativa bayesiana (BGM), un marco unificado que utiliza un algoritmo de actualización bayesiana estocástica iterativa para aprender un modelo generativo único capaz de realizar inferencias condicionales arbitrarias con cuantificación rigurosa de la incertidumbre, sin necesidad de reentrenamiento.

Qiao Liu, Wing Hung WongWed, 11 Ma🤖 cs.AI

Robust Assortment Optimization from Observational Data

Este trabajo propone un marco robusto para la optimización de surtidos basado en datos observacionales que maximiza los ingresos esperados en el peor de los casos ante cambios en las preferencias de los clientes, estableciendo garantías teóricas sobre la complejidad de la muestra y definiendo la "cobertura robusta por artículo" como el requisito mínimo de datos para un aprendizaje eficiente.

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose BlanchetWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Este trabajo estudia los procesos de decisión de Markov robustos no rectangulares bajo el criterio de recompensa promedio, demostrando que las políticas óptimas pueden caracterizarse mediante una representación minimax sin necesidad de rectangularidad, estableciendo la existencia de tales políticas bajo una suposición de comunicación débil e introduciendo un marco de valor transitorio que revela cómo la optimalidad en recompensa promedio puede ocultar un rendimiento temporal deficiente, lo que lleva a la construcción de una política basada en épocas que logra un valor transitorio de orden constante.

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabajo presenta un marco de redes neuronales informadas por física (PINN) que logra una estimación robusta de parámetros biofísicos y la reconstrucción de estados ocultos en modelos neuronales multiescala, superando las limitaciones de los métodos tradicionales al requerir solo observaciones parciales de voltaje y funcionar eficazmente incluso con estimaciones iniciales no informativas.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este trabajo presenta el modelo VI 2D SSM, una arquitectura de espacio de estados bidimensional que garantiza la equivarianza a la permutación en series temporales multivariantes mediante una descomposición teórica en dinámicas locales e interacciones globales, eliminando dependencias secuenciales innecesarias y logrando un rendimiento superior en diversas tareas de predicción y clasificación.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

Este artículo demuestra que no es posible diseñar un procedimiento de verificación de alineación que sea simultáneamente sonoro, general y tratable, estableciendo un trilema fundamental que define los límites teóricos de la certificación formal de la seguridad en la IA.

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

El artículo presenta Midicoth, un sistema de compresión sin pérdida que mejora la estimación de probabilidades en modelos adaptativos mediante una capa de denoising de micro-difusión basada en un árbol binario que corrige las distorsiones causadas por el suavizado de priores en contextos escasos.

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

Este trabajo propone un marco de aprendizaje por refuerzo meta-multinivel que combina la compresión eficiente de procesos de decisión de Markov mediante jerarquías de habilidades con un aprendizaje curricular, logrando así reducir la complejidad de la búsqueda de políticas, facilitar la transferencia de habilidades entre tareas y niveles, y garantizar la consistencia teórica bajo suposiciones moderadas.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

Este artículo introduce el Campo de Transición Markoviano Temporal (TMTF), una extensión del método MTF que divide la serie temporal en segmentos contiguos para estimar matrices de transición locales, preservando así la información sobre cuándo ocurren los cambios de régimen y evitando el promediado engañoso de dinámicas no estacionarias.

Michael LeznikWed, 11 Ma🤖 cs.LG

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Este artículo presenta un marco ablativo integral para la predicción selectiva que introduce el método de apuestas informado por transferencia (TIB) para mejorar la cuantificación de incertidumbre en entornos con escasez de datos mediante el uso de perfiles de riesgo de dominios fuente, demostrando superioridad teórica y empírica sobre nueve familias de cotas existentes en múltiples benchmarks.

Abhinaba BasuWed, 11 Ma🤖 cs.AI

Functional Bias and Tangent-Space Geometry in Variational Inference

Este artículo presenta un marco geométrico que demuestra cómo el sesgo de primer orden en los funcionales posteriores bajo inferencia variacional está determinado por las componentes ortogonales al espacio tangente de la familia variacional, explicando así la distorsión sistemática de las dependencias entre bloques en los métodos de campo medio.

Sean PlummerWed, 11 Ma📊 stat

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

El artículo presenta ULFS-KDPE, un estimador de plug-in sesgado basado en un modelo desfavorable universal dentro de un espacio de Hilbert de núcleo reproductor (RKHS), que permite estimar parámetros diferenciables en modelos no paramétricos alcanzando la eficiencia semiparamétrica sin necesidad de derivar ni evaluar explícitamente las funciones de influencia eficiente.

Haiyi Chen, Yang Liu, Ivana MalenicaWed, 11 Ma🤖 cs.LG