stat.ML artículos | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Este trabajo introduce los estimadores de gradiente ReinMax-Rao y ReinMax-CV, que aplican técnicas de Rao-Blackwellización y variables de control al método ReinMax para reducir su varianza y mejorar el entrenamiento de autoencoders variacionales con variables latentes discretas, ofreciendo además una nueva perspectiva numérica sobre dicho enfoque.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Este trabajo establece un límite de arrepentimiento bayesiano sublineal de orden $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ para el algoritmo de muestreo posterior con procesos gaussianos en control continuo con espacios de estado no acotados, resolviendo las limitaciones teóricas previas al demostrar que los estados visitados permanecen acotados con alta probabilidad y aplicando métodos de cadenas para lograr una dependencia óptima con la ganancia de información máxima.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Este trabajo presenta un nuevo método basado en optimización por gradiente que genera explicaciones contrafactuales plausibles para la clasificación de series temporales, integrando la alineación soft-DTW con vecinos más cercanos para garantizar una estructura temporal realista y superando a los enfoques existentes en coherencia distribucional.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Este artículo establece una equivalencia formal entre los métodos de reducción de varianza utilizados en experimentación en línea y evaluación fuera de política, demostrando que los estimadores de diferencias de medias son idénticos a los de puntuación de propensión inversa con control variado óptimo, y que los ajustes de regresión son estructuralmente equivalentes a la estimación doblemente robusta.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Este artículo presenta un nuevo algoritmo de optimización basado en el cálculo fraccional que utiliza integrales de Weyl ponderadas para reemplazar los gradientes instantáneos con una memoria histórica dinámica, logrando así una mejora significativa en la detección de fraudes financieros y diagnósticos médicos al mitigar el sobreajuste en conjuntos de datos desequilibrados.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Este trabajo propone un método eficiente de predicción credal basado en la recalibración y la descalibración que genera intervalos de probabilidad plausibles sin necesidad de reentrenar ensembles, permitiendo así la cuantificación de incertidumbre epistémica en modelos complejos como TabPFN y CLIP.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Este trabajo supera la barrera de sesgo en el aprendizaje por refuerzo multiobjetivo con escalarización cóncava mediante un algoritmo de gradiente de política natural equipado con un estimador Monte Carlo de múltiples niveles, logrando una complejidad de muestra óptima de $\widetilde{\mathcal{O}}(\epsilon^{-2})$ y demostrando que, bajo suavidad de segundo orden, el sesgo de primer orden se cancela automáticamente.

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

El artículo propone Generative Adversarial Regression (GAR), un marco que utiliza un enfoque minimax para entrenar generadores que aprenden escenarios de riesgo condicionales alineados con objetivos de riesgo elicitables (como VaR y ES), demostrando en datos del S&P 500 una superioridad en la preservación del riesgo frente a métodos tradicionales.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Este trabajo establece límites teóricos sobre el error de aproximación en la representación de estados para el aprendizaje por refuerzo, demostrando cómo la calidad de la representación basada en autovectores del Laplaciano depende de la conectividad algebraica del grafo de transiciones y proporcionando una descomposición del error que incluye la estimación de dichos autovectores.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Este artículo presenta Momentum SVGD-EM, un método acelerado mediante la introducción de aceleración de Nesterov en los parámetros y en el espacio de medidas de probabilidad para optimizar la estimación de máxima verosimilitud marginal (MMLE) mediante el descenso de gradiente variacional de Stein (SVGD), logrando una convergencia más rápida en diversos escenarios de baja y alta dimensionalidad.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

Este artículo introduce los modelos de cuello de botella causal estructural (SCBMs), un marco novedoso que asume que los efectos causales entre variables de alta dimensión dependen únicamente de estadísticas resumidas de baja dimensión, permitiendo una reducción de dimensiones específica para tareas y una estimación eficiente en escenarios de aprendizaje con pocas muestras.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Este artículo propone un método de ramificación y acotación disyuntiva junto con nuevas relajaciones convexas para resolver el problema de completado de matrices de bajo rango hasta la optimalidad certificada, logrando una reducción significativa en el error de prueba en comparación con los métodos heurísticos existentes.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Este artículo propone un marco de agregación basado en transporte óptimo para combinar modelos de Mezcla de Expertos (MoE) distribuidos en un estimador global coherente, logrando un rendimiento comparable al entrenamiento centralizado con un único paso de comunicación y menores costos computacionales.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Este artículo propone dos criterios robustos y un algoritmo de diferencia de convexos para aprender reglas de tratamiento óptimas en datos de supervivencia censurados, enfocándose en maximizar el tiempo de supervivencia truncado y las probabilidades de supervivencia bufferizadas, con validación teórica y empírica que demuestra un rendimiento superior frente a métodos existentes.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Este artículo presenta una formulación de control singular para problemas de parada óptima exploratoria mediante tiempos de parada aleatorizados y regularización por entropía residual, identificando la estrategia óptima única y proponiendo algoritmos de aprendizaje por refuerzo basados y libres de modelo con garantías de mejora de política.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

El artículo presenta EarthquakeNPP, una nueva plataforma de referencia que corrige deficiencias en benchmarks anteriores y demuestra mediante experimentos que, a diferencia del modelo ETAS, los Procesos Puntuales Neuronales actuales aún no superan los métodos tradicionales para la predicción de sismos.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

El artículo propone una teoría de memorización geométrica que demuestra cómo los modelos de difusión experimentan un colapso suave en su capacidad de variación a medida que los datos escasean, condensándose gradualmente en configuraciones de baja energía que replican ejemplos específicos antes de alcanzar una copia exacta.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

El artículo presenta CLIQUE, un nuevo método agnóstico al modelo para calcular la importancia local de variables que captura relaciones dependientes y comportamientos de interacción en problemas de clasificación multiclase, superando las limitaciones de técnicas populares como LIME y SHAP.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Este artículo propone un modelo estadístico general para comparaciones por pares que elimina la suposición de transitividad estocástica, utilizando una matriz antisimétrica de baja dimensión para lograr un rendimiento predictivo superior y óptimo en escenarios complejos con datos dispersos.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Este estudio propone un algoritmo que ajusta la clasificación de máquinas de vectores de soporte (SVM) en espacios no euclidianos incorporando la covarianza de los datos mediante descomposición de Cholesky, demostrando que este enfoque supera el rendimiento de los métodos SVM tradicionales al reconocer que las condiciones de optimalidad de KKT y el principio de margen máximo son subóptimos fuera de los espacios euclidianos.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Anterior Siguiente →