stat.ML artículos | Gist.Science

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Este artículo introduce un presupuesto de deriva intrínseco basado en la distancia de Fisher-Rao para cuantificar el movimiento geométrico de la distribución de datos en entornos de aprendizaje en bucle cerrado, demostrando que la reproducibilidad prequencial está acotada por una tasa que combina la incertidumbre estadística estándar y la velocidad de deriva acumulada, estableciendo así un límite fundamental de precisión cuando la deriva inducida por el aprendizaje es significativa.

Sofiya Zaichyk2026-03-05🤖 cs.LG

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Este artículo presenta un marco estadístico unificado que demuestra que la augmentación sintética en aprendizaje desequilibrado no siempre es beneficiosa, identificando condiciones teóricas para su utilidad y proponiendo el método VTSS para optimizar el tamaño de la muestra sintética mediante validación.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

Universal Coefficients and Mayer-Vietoris Sequence for Groupoid Homology

Este artículo estudia la homología de grupoides amplios mediante complejos de Moore con soporte compacto, estableciendo secuencias exactas de Mayer-Vietoris y una secuencia universal de coeficientes para coeficientes discretos, al tiempo que identifica las obstrucciones para coeficientes no discretos y demuestra la invariancia bajo equivalencia de Kakutani.

Luciano Melodia2026-03-05🤖 cs.LG

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Este artículo propone un modelo estadístico basado en factorización tensorial que combina puntuaciones automáticas de bajo costo con un conjunto limitado de etiquetas humanas para realizar evaluaciones eficientes y precisas a nivel de prompt, superando las limitaciones de datos y alineándose mejor con el juicio humano.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Causal Learning Should Embrace the Wisdom of the Crowd

Este artículo propone un nuevo paradigma para el aprendizaje causal que integra plataformas de crowdsourcing, modelos de expertos y simulaciones con LLMs para sintetizar conocimientos fragmentados y recuperar estructuras causales globales que ningún agente individual podría descubrir por sí solo.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

The Theory behind UMAP?

Este artículo corrige los errores presentes en la implementación original de UMAP por McInnes et al., ofrece una derivación completa y autorreferida de los funtores de Spivak y su variante finita, y analiza la correspondencia teórica entre dicha variante y el algoritmo UMAP.

David Wegmann2026-03-05🤖 cs.LG

Learning Order Forest for Qualitative-Attribute Data Clustering

Este artículo propone un método de agrupamiento basado en un "bosque de orden de aprendizaje" que utiliza estructuras de árbol para representar relaciones de orden en datos cualitativos, logrando mediante un mecanismo de aprendizaje conjunto una mayor precisión en comparación con métodos existentes.

Mingjie Zhao, Sen Feng, Yiqun Zhang + 3 more2026-03-05🤖 cs.AI

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Este artículo propone una estrategia de selección de parámetros adaptativa para los algoritmos de descenso de gradiente basados en kernels, que integra el análisis de sesgo-varianza y la dimensión efectiva empírica para demostrar teóricamente que alcanza el límite óptimo de error de generalización y supera a los métodos existentes.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Surprisal-Rényi Free Energy

Este trabajo introduce la Energía Libre de Sorpresa-Rényi (SRFE), un funcional log-momentual que recupera las divergencias KL directa e inversa como límites singulares, revelando un compromiso explícito entre media y varianza, estableciendo una caracterización variacional de tipo Gibbs y proporcionando una interpretación precisa de la Longitud Mínima de Descripción mediante el control de desviaciones grandes en la longitud de código.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Este trabajo propone un modelo escalable de descubrimiento causal que, mediante reglas de orientación contrastiva entre regímenes observacionales e intervencionales suaves desconocidos, recupera asintóticamente una estructura causal globalmente consistente y supera a los métodos no contrastivos en precisión y generalización.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Los autores proponen un algoritmo óptimo para el aprendizaje por refuerzo con observaciones de estado retrasadas que combina el método de aumento y la cota superior de confianza, logrando un límite de arrepentimiento minimax de $\tilde{\mathcal{O}}(H \sqrt{D_{\max} SAK})$ y estableciendo un límite inferior coincidente que demuestra la optimalidad del enfoque.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

El artículo demuestra que la vulnerabilidad a ejemplos adversarios surge de una desalineación exponencial entre las variedades perceptuales de las máquinas y las humanas, donde la dimensión excesivamente alta de los conceptos de las redes neuronales crea un espacio de entrada donde cualquier perturbación imperceptible puede fácilmente cruzar hacia otra clase, lo que implica que la robustez requiere alinear estas dimensiones.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

El artículo presenta CausalMix, un marco generativo variacional que cierra la brecha entre el realismo distribucional y el control causal en datos tabulares mixtos, permitiendo la manipulación independiente de mecanismos como el solapamiento, la confusión y la heterogeneidad del efecto del tratamiento para validar métodos y diseñar estudios en inferencia causal.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

Empirical Evaluation of No Free Lunch Violations in Permutation-Based Optimization

Este estudio demuestra que la reformulación algebraica de funciones objetivo en problemas de optimización permutativa genera desviaciones locales estructuradas del Teorema de No Hay Almuerzo Gratis, alterando los patrones de rendimiento y las clasificaciones de algoritmos incluso cuando el espacio de funciones subyacente mantiene la simetría global.

Grzegorz Sroka2026-03-05🔢 math

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Este trabajo presenta un marco riguroso que extiende los operadores neuronales para manejar funciones fuera de la distribución mediante aproximaciones de kernels y espacios de Hilbert de núcleo reproductor, permitiendo la captura precisa de valores y derivadas, lo cual se valida empíricamente en la resolución de ecuaciones diferenciales parciales elípticas en variedades.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Este trabajo demuestra que el esquema de Euler-Maruyama geométrico para ecuaciones diferenciales estocásticas en variedades riemannianas alcanza una convergencia fuerte de orden 1/2 bajo ciertas condiciones de regularidad, proporcionando además un límite de Wasserstein para el muestreo mediante la dinámica de Langevin riemanniana.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

A Stein Identity for q-Gaussians with Bounded Support

Este trabajo deriva una nueva identidad de Stein para q-Gaussianas con soporte acotado, demostrando teoremas de tipo Bonnet y Price mediante distribuciones de escolta para obtener estimadores de gradiente de baja varianza que facilitan su aplicación en aprendizaje profundo bayesiano y minimización sensible a la agudeza.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Este trabajo establece límites de error finitos para modelos de difusión basados en puntuación que demuestran que estos modelos se adaptan a la geometría intrínseca de los datos de baja dimensión, mitigando la maldición de la dimensionalidad mediante tasas de convergencia que dependen de la dimensión de Wasserstein $(p,q)$ en lugar de la dimensión ambiental, sin requerir suposiciones restrictivas de soporte compacto o densidad suave.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Este trabajo propone el marco "Two-Phase Suffix Imitation" para resolver el problema de los Contextual Bandits Inversos sin recompensas, demostrando que un observador pasivo puede recuperar la política óptima con una tasa de convergencia de $\tilde O(1/\sqrt{N})$ al ignorar la fase inicial de exploración y aprender únicamente de los datos de imitación de un agente no estacionario.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG

Observationally Informed Adaptive Causal Experimental Design

Este trabajo presenta R-Design, un marco de diseño experimental adaptativo que aprovecha datos observacionales como prior para estimar eficientemente los residuos de sesgo, demostrando teórica y empíricamente que corregir un modelo sesgado es significativamente más eficiente que aprender un modelo causal desde cero.

Erdun Gao, Liang Zhang, Jake Fawkes + 5 more2026-03-05🤖 cs.LG

← Anterior Siguiente →