A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Este artículo propone un método de programación cuadrática secuencial estocástica con región de confianza y punto interior (TR-IP-SSQP) para resolver problemas de optimización con función objetivo estocástica y restricciones deterministas, demostrando su convergencia casi segura y su rendimiento práctico mediante pruebas en conjuntos de datos estándar y regresión logística.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Este artículo demuestra que, cuando la distribución previa condicional a los hiperparámetros es una distribución canónica de máxima entropía, la distribución marginal dependiente resultante también posee una propiedad de máxima entropía bajo una restricción diferente sobre la distribución marginal de una función de las cantidades desconocidas, aclarando así la información asumida al asignar un modelo jerárquico bayesiano.

Brendon J. BrewerThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este trabajo aborda el problema de identificación del mejor brazo en banditos lineales no estacionarios estableciendo un límite inferior dependiente del conjunto de brazos y proponiendo el algoritmo Adjacent-BAI\textsf{Adjacent-BAI}, que logra una probabilidad de error óptima al aprovechar la estructura geométrica del conjunto de brazos.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

El artículo presenta los Procesos de Mezcla Gaussiana Generalizada (GGMP), un método basado en procesos gaussianos que permite la estimación de densidades condicionales multimodales y heterocedásticas mediante una combinación de ajuste local, alineación de componentes y entrenamiento por componente, ofreciendo una solución tratable y escalable para datos no gaussianos complejos.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Este trabajo demuestra que el descenso de gradiente precondicionado en el espacio dual converge a una solución que interpola los datos en modelos lineales sobreparametrizados y caracteriza su sesgo implícito, mostrando que para precondicionadores isotrópicos minimiza la distancia de Frobenius respecto a la inicialización, comportándose de manera análoga al descenso de gradiente estándar.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artículo compara la aproximación bayesiana mediante Dropout de Monte Carlo y el marco de Predicción Conformal para la estimación de incertidumbre en redes neuronales convolucionales, demostrando que, aunque algunos modelos logran mayor precisión, la evaluación de la calibración y la validez estadística es fundamental para desarrollar sistemas de aprendizaje profundo más fiables y seguros.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

El artículo presenta ReTabSyn, un pipeline de síntesis de datos tabulares basado en aprendizaje por refuerzo que, al priorizar la distribución condicional y ofrecer retroalimentación directa sobre la preservación de correlaciones, supera a los métodos actuales en escenarios con datos limitados, desequilibrados o con cambios de distribución, mejorando así la utilidad de los modelos downstream.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artículo presenta un marco de predicción selectiva para la recuperación de estructuras moleculares a partir de espectros de masas que, mediante la cuantificación de incertidumbre a nivel de recuperación, permite a los modelos abstenerse de hacer predicciones dudosas para garantizar un control riguroso de la tasa de error en aplicaciones de alto riesgo.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artículo presenta un marco unificado de optimización bayesiana mediante procesos gaussianos que acelera la búsqueda de puntos estacionarios en superficies de energía potencial mediante un bucle de seis pasos, extensiones avanzadas de kernels y regularización, y una implementación práctica en Rust que demuestra la viabilidad de este enfoque para sistemas de alta dimensión.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Este artículo presenta Ancestral GFlowNet (AGFN), un algoritmo de aprendizaje por refuerzo que realiza inferencia distribucional sobre grafos ancestrales integrando conocimiento experto a priori y retroalimentación incierta a posteriori para refinar modelos causales bajo confusión latente.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

L0-Regularized Quadratic Surface Support Vector Machines

Este artículo propone variantes dispersas de las máquinas de vectores de soporte de superficie cuadrática (QSVM) mediante una restricción de cardinalidad 0\ell_0, presentando un algoritmo de descomposición de penalización que garantiza condiciones de optimalidad, asegura la convergencia y demuestra un rendimiento competitivo y interpretable en tareas de puntuación crediticia.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG