stat.ML artículos | Gist.Science

Invariance-Based Dynamic Regret Minimization

Este artículo presenta ISD-linUCB, un algoritmo para banditos lineales estocásticos no estacionarios que minimiza el arrepentimiento dinámico al descomponer el modelo de recompensa en componentes estacionarios y no estacionarios, aprovechando así los datos históricos para identificar invariancias y reducir la dimensionalidad del problema en entornos de cambio rápido.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artículo presenta un marco metodológico jerárquico que combina inferencia bayesiana, modelos de cierre basados en aprendizaje automático y una estrategia de optimización bilevel con surrogados (FNO y PINN) para resolver simultáneamente problemas inversos de parámetros y aprender dinámicas desconocidas en sistemas de EDOs y EDPs utilizando datos de múltiples sistemas físicos relacionados.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Este artículo presenta el algoritmo FCSR para la identificación de la mejor mano en banditos agrupados bajo restricciones de viabilidad y presupuesto fijo, demostrando teóricamente una cota inferior óptima para la probabilidad de error y validando su superioridad empírica frente a las bases naturales.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Este trabajo propone un algoritmo de subgradiente disperso que aprovecha la estructura algebraica de las redes neuronales Max-Plus para optimizar la pérdida del peor caso de manera eficiente, superando las limitaciones de la retropropagación estándar al explotar la dispersión natural de los subgradientes.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

El artículo demuestra que la regularización de pesos, específicamente mediante penalizaciones L2, mejora significativamente la estabilidad y la consistencia de las características aprendidas por los autoencoders dispersos (SAE) entre diferentes semillas aleatorias, aumentando así la tasa de éxito en la dirección de modelos de lenguaje sin comprometer la interpretabilidad automática.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Este trabajo presenta una perspectiva basada en la verosimilitud para la agregación de densidades mediante medias generalizadas, demostrando teórica y empíricamente que solo el rango de orden $r \in [0,1]$ garantiza mejoras sistemáticas sobre las distribuciones individuales, lo que justifica el uso predominante de la agregación lineal y geométrica en ensambles profundos.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Este trabajo presenta LSDM, un marco novedoso para el modelado generativo semi-supervisado que aprende un espacio latente utilizando datos emparejados y no emparejados para realizar una coincidencia de distribuciones que mejora la fidelidad geométrica y ofrece una perspectiva teórica unificada que conecta con modelos de difusión latente.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

El artículo presenta PTOPOFL, un marco de aprendizaje federado personalizado que protege la privacidad y mejora la precisión en distribuciones no IID al sustituir el intercambio de gradientes por descriptores topológicos de homología persistente, logrando una menor fuga de información y un rendimiento superior en escenarios de salud y patológicos.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Este artículo reencuadra el diseño de redes neuronales cuánticas desde la alcanzabilidad del estado hacia la aprendibilidad mediante principios geométricos y el criterio de selectividad local casi completa (aCLS), demostrando que acoplar datos y pesos con entrelazamiento parametrizado permite deformaciones geométricas adaptativas más eficientes.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

Este artículo presenta resultados de alta calidad en la síntesis de imágenes utilizando modelos de difusión probabilística, logrando puntuaciones de estado del arte en CIFAR10 y calidad comparable a ProgressiveGAN en LSUN mediante un límite variacional ponderado que conecta estos modelos con el aprendizaje de puntuación y la dinámica de Langevin.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

El artículo establece leyes empíricas de escalado que demuestran que el rendimiento de los modelos de lenguaje sigue una ley de potencias en función del tamaño del modelo, el conjunto de datos y la capacidad de cómputo, revelando que la asignación óptima de recursos implica entrenar modelos muy grandes en conjuntos de datos relativamente pequeños y detener el entrenamiento antes de la convergencia completa.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

Los autores proponen un nuevo marco para estimar modelos generativos mediante un proceso adversarial que entrena simultáneamente una red generadora y una discriminadora en un juego minimax, permitiendo la generación de muestras sin necesidad de cadenas de Markov o inferencia aproximada.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

Este artículo presenta un algoritmo de inferencia variacional estocástica que, mediante una reparametrización del límite inferior y el uso de un modelo de reconocimiento, permite realizar un aprendizaje eficiente y escalable en modelos probabilísticos dirigidos con variables latentes continuas y conjuntos de datos grandes.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← Anterior