stat.ML artículos | Gist.Science

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Este trabajo establece garantías finitas de muestra para un método de aprendizaje de representaciones de estado impulsado por costos que predice costos multietapa sin observar acciones ni observaciones, logrando así un controlador y una representación casi óptimos para problemas de control lineal cuadrático gaussiano (LQG) de horizonte finito.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

Este artículo demuestra que es posible alcanzar tasas de convergencia minimax para funcionales doblemente robustos en todas las clases de suavidad de Hölder mediante la combinación estratégica de técnicas de división de muestras y ajustes de los parámetros de suavizado de las funciones de nuisance, superando así las limitaciones de la literatura existente.

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

A Robust Multi-Item Auction Design with Statistical Learning

Este artículo propone un nuevo método de aprendizaje estadístico para subastas de múltiples artículos que utiliza intervalos de credibilidad para reducir los costos de implementación manteniendo la equidad, la compatibilidad de incentivos y la racionalidad individual, logrando simultáneamente la maximización de ingresos y la reducción de costos.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

El artículo presenta OTAD, un modelo de defensa adversarial robusto que combina el entrenamiento de redes neuronales con regularización basada en transporte óptimo y la interpolación mediante problemas de integración convexa para lograr tanto una alta precisión en los datos como una continuidad Lipschitz local certificada.

Kuo Gai, Sicong Wang, Shihua ZhangTue, 10 Ma🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Este artículo establece las bases estadísticas y ofrece orientación práctica para el estimador de máxima verosimilitud parcial por mini-lotes (mb-MPLE) en modelos de Cox profundos, demostrando su consistencia, convergencia óptima y utilidad en aplicaciones a gran escala donde los métodos estándar son inviables.

Lang Zeng, Weijing Tang, Zhao Ren, Ying DingTue, 10 Ma🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John PaisleyTue, 10 Ma🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Este trabajo presenta BNEM, un muestreador de Boltzmann basado en la coincidencia de energía ruidosa y una técnica de *bootstrapping* que permite generar muestras independientes a partir de funciones de energía conocidas, logrando un rendimiento superior y mayor robustez en comparación con métodos existentes.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-LobatoTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Los autores proponen un marco unificado de aprendizaje por transferencia para el agrupamiento, denominado ATC, que optimiza automáticamente el aprovechamiento de la información común entre conjuntos de datos principales y auxiliares a pesar de discrepancias desconocidas, demostrando su optimalidad teórica y eficacia práctica en diversos modelos estadísticos.

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Este artículo establece límites de error para el riesgo excesivo en problemas de clasificación con etiquetas ruidosas dentro de marcos de aprendizaje profundo, descomponiendo el error en componentes estadísticos y de aproximación mediante técnicas de bloques independientes y la hipótesis de variedades de baja dimensión.

Haixia Liu, Boxiao Li, Can Yang, Yang WangTue, 10 Ma🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

El artículo presenta A3RL, un nuevo método de aprendizaje por refuerzo que combina datos en línea y fuera de línea mediante una estrategia de muestreo activa y consciente de la confianza para mejorar la eficiencia de las muestras y superar el olvido catastrófico, logrando un rendimiento superior frente a técnicas existentes.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin ChenTue, 10 Ma🤖 cs.LG

Adaptive Replication Strategies in Trust-Region-Based Bayesian Optimization of Stochastic Functions

Este artículo presenta un método de optimización bayesiana basado en regiones de confianza que utiliza réplicas adaptativas para mejorar significativamente la precisión y la eficiencia computacional en la optimización de funciones estocásticas con alta varianza.

Mickael Binois (ACUMES), Jeffrey Larson (ANL)Tue, 10 Ma🔢 math

Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data

Este artículo propone un marco de optimización de políticas offline personalizado para poblaciones heterogéneas, introduciendo el algoritmo P4L que utiliza variables latentes individuales para estimar funciones Q y garantizar un bajo arrepentimiento promedio bajo supuestos de cobertura parcial débiles.

Rui Miao, Babak Shahbaba, Annie QuTue, 10 Ma🤖 cs.LG

Online Decision-Focused Learning

Este artículo presenta los primeros algoritmos en línea con garantías teóricas de arrepentimiento para el aprendizaje enfocado en la toma de decisiones (DFL) en entornos dinámicos, superando los desafíos de la falta de gradientes y la no convexidad mediante técnicas de regularización y perturbación.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain DurmusTue, 10 Ma🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Este artículo demuestra que los métodos de imputación basados en MICE son una alternativa eficaz y más sencilla de implementar que las redes generativas adversarias y los autoencoders para generar datos sintéticos de alta fidelidad en la tarificación actuarial, preservando tanto las distribuciones marginales como las relaciones multivariadas necesarias para entrenar modelos GLM.

Yevhen Havrylenko, Meelis Käärik, Artur TuttarTue, 10 Ma🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Este artículo propone la clase de métodos F²SA- $p$ que utiliza diferencias finitas de orden $p$ para aproximar el hipergradiente en optimización bilevel estocástica, logrando una complejidad superior de $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ para problemas altamente suaves y demostrando que esta tasa es casi óptima al coincidir con el límite inferior $\Omega(\epsilon^{-4})$ en regiones de suavidad suficientemente alta.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao ZhangTue, 10 Ma🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Este trabajo presenta un método que combina aprendizaje profundo y conductancias de entrada dinámicas (DICs) para reconstruir rápidamente poblaciones degeneradas de modelos neuronales basados en conductancia a partir únicamente de tiempos de disparo, resolviendo así el desafío de inferir parámetros biofísicos a pesar de la variabilidad en las conductancias iónicas.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur FyonTue, 10 Ma🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Este artículo presenta un nuevo límite PAC-Bayes empírico para cadenas de Markov que, al proporcionar una cota empírica para el pseudo-espacio espectral en espacios de estado finitos, elimina la dependencia de constantes teóricas desconocidas y ofrece la primera garantía de generalización completamente empírica para este tipo de procesos.

Vahe Karagulyan, Pierre AlquierTue, 10 Ma🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Este artículo presenta los GDR-learners, una nueva familia de modelos generativos que integran la ortogonalidad de Neyman para estimar distribuciones de resultados potenciales con eficiencia cuasi-oráculo y doble robustez, superando a los métodos existentes mediante su implementación en flujos normalizantes, GANs, VAEs y modelos de difusión condicionales.

Valentyn Melnychuk, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabajo introduce la Regularización Adaptativa al Solapamiento (OAR), un nuevo enfoque que mejora la estimación del efecto promedio condicional del tratamiento en regiones de bajo solapamiento al regularizar los modelos meta-learners proporcionalmente a los pesos de solapamiento, preservando además la ortogonalidad de Neyman para una inferencia más robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artículo presenta el DRQ-learner, un nuevo meta-aprendiz causal para la estimación de resultados potenciales individualizados en procesos de decisión de Markov que garantiza doble robustez, ortogonalidad de Neyman y eficiencia cuasi-oráculo, superando a los métodos existentes en diversos escenarios y modelos de aprendizaje automático.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

← Anterior Siguiente →