stat.ML artículos | Gist.Science

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Este artículo presenta SurvHTE-Bench, el primer benchmark integral para la estimación de efectos heterogéneos del tratamiento en análisis de supervivencia, que evalúa rigurosamente diversos métodos mediante conjuntos de datos sintéticos, semisintéticos y del mundo real para establecer un estándar de evaluación justo y reproducible.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Sample-Optimal Locally Private Hypothesis Selection and the Provable Benefits of Interactivity

Este trabajo presenta un algoritmo óptimo de selección de hipótesis bajo privacidad diferencial local que, mediante un número logarítmico de rondas interactivas, reduce la complejidad de muestra de $O(k \log k)$ a $O(k)$ , superando así las limitaciones de los métodos no interactivos anteriores.

Alireza F. Pour, Hassan Ashtiani, Shahab Asoodeh2026-03-05🤖 cs.LG

List Sample Compression and Uniform Convergence

Este artículo demuestra que, aunque la convergencia uniforme sigue siendo equivalente a la aprendibilidad en el aprendizaje de listas PAC, la conjetura de compresión de muestras de Littlestone y Warmuth falla en este contexto, ya que existen clases aprendibles que no pueden comprimirse incluso con listas de tamaño arbitrario.

Steve Hanneke, Shay Moran, Tom Waknine2026-03-05🤖 cs.LG

Tracking solutions of time-varying variational inequalities

Este trabajo extiende las garantías de seguimiento para desigualdades variacionales dependientes del tiempo, proporcionando cotas para funciones no monótonas y problemas periódicos sin restricción en la longitud de la trayectoria, además de analizar la convergencia y el comportamiento caótico de los sistemas dinámicos discretos asociados.

Hédi Hadiji, Sarah Sachs, Cristóbal Guzmán2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

El artículo presenta AuToMATo, un algoritmo de agrupamiento basado en homología persistente que, mediante la combinación de ToMATo con un procedimiento de *bootstrapping* y parámetros predeterminados, ofrece una solución "llave en mano" que supera a otros métodos de vanguardia y se integra eficazmente con el algoritmo Mapper en el análisis topológico de datos.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

Este artículo propone LoCo-RLHF, un marco de aprendizaje por refuerzo basado en retroalimentación humana que utiliza estructuras de bajo rango y un enfoque pesimista en subespacios reducidos para alinearse eficazmente con preferencias humanas heterogéneas y manejar cambios distribucionales con mayor eficiencia computacional.

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

El artículo presenta DCENWCNet, un nuevo modelo de red neuronal convolucional en conjunto que integra tres arquitecturas con configuraciones únicas para clasificar células blancas de la sangre con alta precisión y utiliza LIME para mejorar la interpretabilidad de sus predicciones.

Sibasish Dhibar2026-03-05🤖 cs.AI

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

Este estudio presenta el sPI-GeM, un modelo generativo profundo informado por la física que supera las limitaciones de escalabilidad espacial existentes para resolver con precisión problemas directos e inversos de ecuaciones diferenciales estocásticas en espacios de alta dimensión tanto estocásticos como espaciales.

Shaoqian Zhou, Wen You, Ling Guo + 1 more2026-03-05🔬 physics

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Este artículo presenta un nuevo límite inferior de complejidad de muestra y un algoritmo modificado de Track-and-Stop que logran la optimalidad asintótica para la identificación del mejor brazo en configuraciones de confianza fija con múltiples óptimos cuando el número de estos es conocido.

Lan V. Truong2026-03-05🤖 cs.LG

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Este artículo analiza las propiedades de convergencia y las dinámicas de escape del Descenso de Gradiente Estocástico (SGD) en paisajes unidimensionales, demostrando cómo las características del ruido y la geometría de la función determinan los tiempos de permanencia cerca de máximos locales y las probabilidades de transición hacia mínimos adyacentes.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Este artículo propone un filtro supervisado eficiente basado en un puntaje de concordancia de cola superior derivado de la cópula Gumbel para la selección de características en la predicción de riesgo de diabetes, demostrando mediante dos conjuntos de datos que este método identifica predictores clínicamente relevantes y mejora o iguala el rendimiento de técnicas estándar como Mutual Information y ReliefF.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Este artículo propone Supervised Calibration (SC), un marco unificado basado en la minimización de pérdidas que supera las limitaciones de los métodos de calibración actuales en el aprendizaje en contexto (ICL) al aprender transformaciones afines óptimas que pueden alterar la orientación de los límites de decisión de los LLM, logrando así un rendimiento superior en múltiples conjuntos de datos y modelos.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

Honesty in Causal Forests: When It Helps and When It Hurts

Este artículo demuestra que el uso reflexivo de la estimación honesta en los bosques causales puede reducir la precisión de los efectos del tratamiento al limitar la detección de heterogeneidad, sugiriendo que su aplicación debe basarse en objetivos específicos y evaluación empírica en lugar de adoptarse automáticamente.

Yanfang Hou, Carlos Fernández-Loría2026-03-05🤖 cs.LG

Federated ADMM from Bayesian Duality

Este trabajo propone un nuevo enfoque bayesiano que generaliza el método federado ADMM mediante una estructura de dualidad en objetivos variacionales, permitiendo recuperar actualizaciones tipo ADMM para distribuciones gaussianas isotrópicas y obtener variantes novedosas (como Newton y Adam) que mejoran la convergencia y la precisión en escenarios heterogéneos.

Thomas Möllenhoff, Siddharth Swaroop, Finale Doshi-Velez + 1 more2026-03-05🤖 cs.LG

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Este artículo establece límites de aproximación gaussiana para las distribuciones finitas de redes neuronales profundas con pesos aleatorios y funciones de activación Lipschitz, demostrando que convergen a un límite gaussiano a medida que las anchuras de las capas crecen, con tasas de convergencia específicas para arquitecturas de profundidad fija.

Krishnakumar Balasubramanian, Nathan Ross2026-03-05🤖 cs.LG

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Este artículo analiza el rendimiento asintótico del ensembling de modelos de lenguaje mediante votación mayoritaria cuando el número de muestras tiende a infinito, proponiendo un esquema de generación adaptativo y una optimización de pesos para ensembles múltiples que maximizan la eficiencia y el rendimiento sin requerir un presupuesto infinito.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

Learning in an Echo Chamber: Online Learning with Replay Adversary

Este trabajo introduce el marco de "Aprendizaje en Sala de Eco" para modelar el entrenamiento con datos auto-annotados, demostrando que la dimensión Extendida de Umbral ( $\mathrm{ExThD}$ ) es la medida exacta de la aprendibilidad en este escenario y que los algoritmos basados en cierre logran límites óptimos de errores frente a adversarios de reproducción, superando las limitaciones de los métodos clásicos.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Este trabajo presenta MAYA, un modelo de aprendizaje por imitación basado en banditos multi-brazo que replica las decisiones de forrajeo de las abejas considerando su memoria limitada, superando a los modelos existentes y permitiendo inferir trayectorias realistas para aplicaciones ecológicas.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Este trabajo demuestra que el sesgo implícito del algoritmo Adam con actualizaciones por muestra individual en datos separables puede desviarse del régimen de lote completo, convergiendo en algunos casos hacia clasificadores de margen máximo $\ell_2$ en lugar de $\ell_\infty$ , mientras que el algoritmo Signum mantiene una convergencia invariable hacia el margen máximo $\ell_\infty$ independientemente del tamaño del lote.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Implicit Bias of the JKO Scheme

Este artículo caracteriza el sesgo implícito del esquema JKO en segundo orden, demostrando que aproxima el flujo de gradiente de Wasserstein de una energía modificada que incluye un término de desaceleración basado en la curvatura métrica de la energía original.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

← Anterior Siguiente →

stat.ML