stat.ML artículos | Gist.Science

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

El artículo presenta SPPCSO, un innovador método de estimación penalizada que combina la regresión de componentes principales con regularización $L_1$ para lograr una selección de variables estable y precisa en datos de alta dimensión con alta correlación y ruido, demostrando su eficacia tanto en experimentos numéricos como en el análisis de expresión génica.

Ying Hu, Hu YangMon, 09 Ma🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Este artículo presenta los Entornos de Monitoreo Sintético (SMEs), una suite infinita de tareas de control continuo con políticas óptimas conocidas que permiten diagnósticos precisos y evaluaciones rigurosas de algoritmos de Aprendizaje por Refuerzo, transformando la evaluación empírica en un análisis científico estandarizado.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artículo propone el modelo BAEN-SVM, que utiliza una nueva función de pérdida elástica asimétrica acotada para lograr una clasificación binaria robusta frente al ruido y con propiedades geométricas y teóricas mejoradas, resolviendo su optimización no convexa mediante un algoritmo eficiente.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Este trabajo presenta un marco para el cálculo certificado y preciso de normas en espacios funcionales de redes neuronales profundas, combinando aritmética de intervalos, refinamiento adaptativo y cuadratura para obtener cotas deterministas garantizadas de integrales como las normas $L^p$ y Sobolev, superando las limitaciones de las evaluaciones puntuales tradicionales.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Bayesian Additive Distribution Regression

Este artículo presenta DistBART, un enfoque bayesiano no paramétrico para la regresión de distribuciones que utiliza ensembles de árboles de decisión para modelar funcionales lineales y no lineales, ofreciendo tanto garantías teóricas de concentración del posterior como una aproximación eficiente mediante características aleatorias para escalar a grandes conjuntos de datos.

Antonio R. Linero, Soumyabrata Bose, Jared MurrayMon, 09 Ma📊 stat

Semantics-Aware Caching for Concept Learning

Este artículo presenta un enfoque de caché consciente de la semántica que reduce el tiempo de ejecución del aprendizaje de conceptos en un orden de magnitud al optimizar la recuperación de instancias mediante un mapa sensible a la subsumción, demostrando su eficacia tanto en razonadores simbólicos como neuro-simbólicos.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga NgomoMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Este artículo propone un marco de refutación agnóstico a la representación que establece condiciones teóricas para la no identificabilidad del efecto causal condicional (CATE) y ofrece un método neuronal para calcular cotas de sesgo inducido por la reducción de dimensionalidad, permitiendo así la identificación parcial del CATE en escenarios donde la validez de la estimación se ve comprometida.

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Onflow: a model free, online portfolio allocation algorithm robust to transaction fees

El artículo presenta Onflow, un algoritmo de asignación de carteras basado en aprendizaje por refuerzo y flujos de gradiente que optimiza los retornos logarítmicos sin asumir distribuciones de rentabilidad y demuestra ser robusto y superior a métodos existentes en escenarios con altos costos de transacción.

Gabriel Turinici, Pierre BrugiereFri, 13 Ma💰 q-fin

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

El artículo propone utilizar la Matriz de Información de Datos (DIM) en redes neuronales ReLU entrenadas como clasificadores para revelar una estructura geométrica de foliación singular en los datos, demostrando que esta estructura existe casi en todas partes y que su espectro permite medir distancias entre conjuntos de datos para la transferencia de conocimiento.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Are Bayesian networks typically faithful?

El artículo demuestra que, bajo diversas parametrizaciones y condiciones de regularidad, las redes bayesianas fieles constituyen un conjunto abierto y denso (es decir, son "típicas"), lo que garantiza la consistencia de algoritmos de descubrimiento causal basados en restricciones como PC y FCI en la mayoría de los casos.

Philip Boeken, Patrick Forré, Joris M. MooijFri, 13 Ma📊 stat

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Este artículo presenta el AU-learner, un nuevo método de aprendizaje ortogonal que utiliza identificación parcial para cuantificar la incertidumbre aleatoria del efecto del tratamiento mediante la estimación de límites precisos para su distribución condicional en datos observacionales.

Valentyn Melnychuk, Stefan Feuerriegel, Mihaela van der SchaarFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

Este artículo presenta FINN, una red neuronal informada por finanzas que aprende la geometría de la valoración de opciones mediante un objetivo de cobertura dinámica auto-supervisado, logrando así consistencia económica, recuperación de relaciones fundamentales como la paridad put-call y una adaptación superior a entornos de volatilidad estocástica sin depender de soluciones analíticas o datos históricos de precios de opciones.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Este trabajo propone dos algoritmos basados en Thompson sampling (PE-GP-TS y HP-GP-TS) para la selección adaptativa de priores en banditos de procesos gaussianos, estableciendo límites teóricos de arrepentimiento y demostrando su eficacia mediante experimentos sintéticos y del mundo real.

Jack Sandberg, Morteza Haghir ChehreghaniFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Este artículo presenta un modelo no paramétrico de Grafos de Producto Ponderado Aleatorio (WRDPG) que extiende los modelos tradicionales al permitir la discriminación de distribuciones de pesos de aristas mediante momentos de orden superior, ofreciendo además garantías estadísticas para la estimación de posiciones latentes y un marco generativo para la simulación de grafos ponderados.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Distribution estimation via Flow Matching with Lipschitz guarantees

Este trabajo establece garantías teóricas para la estimación de distribuciones mediante Flow Matching al controlar la dependencia de la constante de Lipschitz, derivando una tasa de convergencia mejorada en la distancia de Wasserstein 1 para distribuciones no acotadas en entornos de alta dimensión sin requerir log-concavidad.

Lea KunkelFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Este artículo investiga la existencia y el cálculo de funciones de Busemann en el espacio de Wasserstein, estableciendo expresiones cerradas para distribuciones unidimensionales y medidas gaussianas que permiten definir nuevas distancias Sliced-Wasserstein aplicables a problemas de aprendizaje por transferencia.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Refereed Learning

Este artículo introduce el concepto de "aprendizaje arbitrado", donde un aprendiz utiliza dos proponentes competidores (uno honesto) para evaluar modelos opacos, logrando protocolos que seleccionan el mejor modelo con una precisión multiplicativa $(1+\varepsilon)$ consultando la función de verdad solo una vez y comunicando una cantidad de bits polinómica, superando así drásticamente la eficiencia de los métodos tradicionales con un solo proponente.

Ran Canetti, Ephraim Linder, Connor WagamanFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Este trabajo propone un marco bayesiano unificado que explica el aprendizaje en contexto y la dirección de activaciones en modelos de lenguaje como mecanismos que alteran las creencias sobre conceptos latentes, permitiendo predecir y controlar su comportamiento mediante la acumulación de evidencia y el ajuste de priores.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Este artículo propone tres algoritmos escalables basados en inferencia variacional y propagación de expectativas para aproximar la distribución posterior en modelos de regresión probit acumulativa, superando las limitaciones computacionales de los métodos MCMC tradicionales y demostrando su eficacia en un estudio de caso sobre redes criminales.

Emanuele AlivertiFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Este artículo resuelve la paradoja entre la conectividad de los valles de pérdida y la confinación de la dinámica de optimización en redes neuronales sobreparametrizadas, demostrando que las barreras entrópicas generadas por la variación de la curvatura y el ruido actúan como fuerzas efectivas que mantienen a los algoritmos localizados en los mínimos, incluso cuando el paisaje de pérdida es plano.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat

← Anterior Siguiente →