stat.ML artículos | Gist.Science

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Este artículo estudia una aproximación por difusión de tiempo continuo del gradiente de política para banditos estocásticos, demostrando que con una tasa de aprendizaje adecuada se logra un arrepentimiento logarítmico, mientras que se construye un caso donde una tasa inadecuada conduce a un arrepentimiento lineal.

Tor LattimoreThu, 12 Ma📊 stat

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artículo propone un método de programación cuadrática secuencial estocástica con región de confianza y punto interior (TR-IP-SSQP) para resolver problemas de optimización con función objetivo estocástica y restricciones deterministas, demostrando su convergencia casi segura y su rendimiento práctico mediante pruebas en conjuntos de datos estándar y regresión logística.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artículo demuestra que, cuando la distribución previa condicional a los hiperparámetros es una distribución canónica de máxima entropía, la distribución marginal dependiente resultante también posee una propiedad de máxima entropía bajo una restricción diferente sobre la distribución marginal de una función de las cantidades desconocidas, aclarando así la información asumida al asignar un modelo jerárquico bayesiano.

Brendon J. BrewerThu, 12 Ma📊 stat

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

El artículo presenta MultiwayPAM, un nuevo método de agrupación tensorial diseñado para analizar las puntuaciones de evaluadores LLM, permitiendo identificar simultáneamente la pertenencia a grupos y los medoides en cada dimensión (preguntas, respondientes y evaluadores) para mitigar el costo computacional y revelar sesgos inherentes.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este trabajo aborda el problema de identificación del mejor brazo en banditos lineales no estacionarios estableciendo un límite inferior dependiente del conjunto de brazos y proponiendo el algoritmo $\textsf{Adjacent-BAI}$ , que logra una probabilidad de error óptima al aprovechar la estructura geométrica del conjunto de brazos.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Designing Service Systems from Textual Evidence

Este artículo presenta PP-LUCB, un algoritmo que optimiza la selección de configuraciones de sistemas de servicio utilizando puntuaciones de modelos de lenguaje grandes corregidas mediante auditorías humanas selectivas para minimizar costos y garantizar la precisión frente a sesgos sistemáticos.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-LeviThu, 12 Ma🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Este artículo presenta WiGS, un método de aprendizaje activo para regresión que utiliza aprendizaje por refuerzo para adaptar dinámicamente el equilibrio entre exploración e investigación, superando a los enfoques basados en reglas multiplicativas estáticas en precisión y eficiencia de etiquetado.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

El artículo presenta los Procesos de Mezcla Gaussiana Generalizada (GGMP), un método basado en procesos gaussianos que permite la estimación de densidades condicionales multimodales y heterocedásticas mediante una combinación de ajuste local, alineación de componentes y entrenamiento por componente, ofreciendo una solución tratable y escalable para datos no gaussianos complejos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Brenier Isotonic Regression

Este artículo propone la "regresión isótona de Brenier", una extensión novedosa de la regresión isótona a múltiples salidas que utiliza el transporte óptimo para imponer la monotonía cíclica, demostrando un rendimiento superior en tareas de calibración de probabilidades y modelos lineales generalizados.

Han Bao, Amirreza Eshraghi, Yutong WangThu, 12 Ma📊 stat

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Este trabajo demuestra que el descenso de gradiente precondicionado en el espacio dual converge a una solución que interpola los datos en modelos lineales sobreparametrizados y caracteriza su sesgo implícito, mostrando que para precondicionadores isotrópicos minimiza la distancia de Frobenius respecto a la inicialización, comportándose de manera análoga al descenso de gradiente estándar.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artículo compara la aproximación bayesiana mediante Dropout de Monte Carlo y el marco de Predicción Conformal para la estimación de incertidumbre en redes neuronales convolucionales, demostrando que, aunque algunos modelos logran mayor precisión, la evaluación de la calibración y la validez estadística es fundamental para desarrollar sistemas de aprendizaje profundo más fiables y seguros.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

El artículo presenta ReTabSyn, un pipeline de síntesis de datos tabulares basado en aprendizaje por refuerzo que, al priorizar la distribución condicional y ofrecer retroalimentación directa sobre la preservación de correlaciones, supera a los métodos actuales en escenarios con datos limitados, desequilibrados o con cambios de distribución, mejorando así la utilidad de los modelos downstream.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

Kernel Tests of Equivalence

Este artículo propone nuevos tests de equivalencia basados en núcleos que utilizan la discrepancia de Stein y la discrepancia máxima media para evaluar la ausencia de diferencias significativas entre distribuciones, superando las limitaciones de los métodos paramétricos tradicionales mediante aproximaciones asintóticas y de remuestreo.

Xing Liu, Axel GandyThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artículo presenta un marco de predicción selectiva para la recuperación de estructuras moleculares a partir de espectros de masas que, mediante la cuantificación de incertidumbre a nivel de recuperación, permite a los modelos abstenerse de hacer predicciones dudosas para garantizar un control riguroso de la tasa de error en aplicaciones de alto riesgo.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artículo presenta un marco unificado de optimización bayesiana mediante procesos gaussianos que acelera la búsqueda de puntos estacionarios en superficies de energía potencial mediante un bucle de seis pasos, extensiones avanzadas de kernels y regularización, y una implementación práctica en Rust que demuestra la viabilidad de este enfoque para sistemas de alta dimensión.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Este artículo presenta Ancestral GFlowNet (AGFN), un algoritmo de aprendizaje por refuerzo que realiza inferencia distribucional sobre grafos ancestrales integrando conocimiento experto a priori y retroalimentación incierta a posteriori para refinar modelos causales bajo confusión latente.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabajo ofrece una revisión exhaustiva y una especificación formal de las redes de codificación predictiva, situándolas como un marco versátil y biológicamente plausible dentro de la inteligencia artificial moderna que supera las limitaciones de la retropropagación tradicional.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

Theoretical Foundations of Conformal Prediction

Este libro presenta una guía pedagógica unificada sobre las bases teóricas de la predicción conforme y técnicas de inferencia sin distribución, reuniendo y demostrando resultados clave dispersos en la literatura para ofrecer garantías de incertidumbre finitas en sistemas de aprendizaje automático sin asumir distribuciones de datos específicas.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Este artículo propone variantes dispersas de las máquinas de vectores de soporte de superficie cuadrática (QSVM) mediante una restricción de cardinalidad $\ell_0$ , presentando un algoritmo de descomposición de penalización que garantiza condiciones de optimalidad, asegura la convergencia y demuestra un rendimiento competitivo y interpretable en tareas de puntuación crediticia.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Este artículo presenta una variante de los pasos de tipo Polyak para el descenso de espejo entrópico aplicado a sistemas lineales, logrando resultados de convergencia y mejorando los límites del sesgo implícito sin requerir suposiciones restrictivas sobre el dominio no acotado.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG

← Anterior Siguiente →