stat.ML artículos | Gist.Science

The Volterra signature

El artículo propone la firma de Volterra como una representación de características explícita y universalmente aproximable para series temporales no markovianas, demostrando su inyectividad, eficiencia computacional mediante ecuaciones diferenciales y ecuaciones integrales, y superioridad empírica frente a los métodos basados en firmas clásicas.

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Oracle-efficient Hybrid Learning with Constrained Adversaries

Este trabajo presenta un algoritmo de aprendizaje híbrido eficiente en oráculos que logra optimalidad estadística y computacional simultánea bajo adversarios restringidos, logrando un regret escalado con la complejidad de Rademacher y permitiendo calcular equilibrios en juegos de suma cero estocásticos con estructuras de baja dimensión.

Princewill Okoroafor, Robert Kleinberg, Michael P. Kim2026-03-06💻 cs

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Este trabajo establece una equivalencia rigurosa entre el algoritmo K-Means y las redes neuronales de funciones de base radial (RBF) mediante un enfoque variacional y basado en gradientes, demostrando que los objetivos RBF convergen a la solución de K-Means y proponiendo el uso de Entmax-1.5 para garantizar estabilidad numérica, lo que permite integrar la clustering diferenciable directamente en arquitecturas de aprendizaje profundo.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

Este trabajo presenta algoritmos óptimos para probar la independencia de distribuciones que, mediante el uso de información predictiva auxiliar, mantienen la validez en el peor de los casos mientras mejoran significativamente la eficiencia de la muestra cuando las predicciones son precisas.

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

sFRC for assessing hallucinations in medical image restoration

Este trabajo propone el método sFRC (Correlación de Anillo de Fourier en parches pequeños y escaneo), una técnica robusta para detectar y cuantificar las alucinaciones en imágenes médicas restauradas mediante aprendizaje profundo y otros métodos, demostrando su eficacia en problemas de CT y MRI con datos submuestreados.

Prabhat Kc, Rongping Zeng, Nirmal Soni + 1 more2026-03-06🔬 physics

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

Este artículo propone que la consolidación de la memoria no solo estabiliza representaciones, sino que optimiza la generalización mediante un "olvido predictivo" que comprime la información reteniendo selectivamente lo que predice resultados futuros, un proceso iterativo que mejora los límites teóricos de generalización y ha sido validado mediante simulaciones en modelos neuronales y de lenguaje.

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Este trabajo presenta la primera caracterización de equivalencia distribucional y un método de descubrimiento estructural sin suposiciones para modelos causales cíclicos lineales no gaussianos con variables latentes, introduciendo restricciones de rango de aristas para identificar y recuperar modelos a partir de datos.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Este artículo demuestra teóricamente que la localidad y el compartimiento de pesos en las redes neuronales convolucionales modifican la regularización implícita inducida por el fenómeno de borde de estabilidad, permitiendo una generalización efectiva en datos esféricos de alta dimensión donde las redes totalmente conectadas fallan, al acoplar los filtros aprendidos a una variedad de parches de baja dimensión.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Este artículo demuestra que, en redes neuronales ReLU de alta dimensión con datos aleatorios, el sesgo implícito del descenso de gradiente aproxima la solución de mínima norma L2 con alta probabilidad, presentando una brecha del orden de $\Theta(\sqrt{n/d})$ entre el número de ejemplos y la dimensión de las características.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Este artículo interpreta el fenómeno del "Edge of Stability" mediante la suavidad direccional y extiende el concepto de agudeza a normas no euclidianas, demostrando que diversos optimizadores geométricamente conscientes exhiben oscilaciones alrededor del umbral de estabilidad $2/\eta$ durante el entrenamiento.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Este artículo presenta fedCI y fedCI-IOD, un marco de aprendizaje federado que permite la prueba de independencia condicional y el descubrimiento causal en conjuntos de datos heterogéneos y distribuidos bajo confusión latente, preservando la privacidad y mejorando el poder estadístico sin necesidad de centralizar los datos.

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics

Este artículo presenta STCV, un nuevo algoritmo de regresión dispersa que utiliza la Coeficiente de Presencia para lograr una identificación robusta de leyes físicas en sistemas dinámicos no lineales, siendo inmune a las distorsiones causadas por la normalización de datos que afectan a los métodos tradicionales como STLSQ.

Jay Raut, Daniel N. Wilke, Stephan Schmidt2026-03-06🤖 cs.LG

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Este artículo propone un marco novedoso para estimar reglas de decisión individualizadas óptimas que incorporan restricciones de paridad demográfica y paridad demográfica condicional, demostrando teóricamente su convergencia y validando su eficacia mediante simulaciones y una aplicación empírica en el experimento de seguro de salud de Oregon.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Este estudio demuestra que el rendimiento óptimo en la detección de cambios de distribución en Vision Transformers se logra combinando el análisis de capas intermedias y módulos específicos, donde la red feedforward es superior ante grandes desplazamientos de distribución y la atención multi-cabeza normalizada lo es ante desplazamientos débiles.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

Este artículo presenta el método de Agrupamiento Causal Supervisado Bayesiano (BSCC), que identifica subgrupos de pacientes homogéneos basándose tanto en sus perfiles de covariables como en sus efectos del tratamiento, y valida su utilidad práctica mediante datos simulados y del Tercer Ensayo Internacional de Ictus.

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Este artículo propone el uso de valores de Shapley asimétricos como una métrica de importancia más honesta y adecuada para evaluar el impacto de características genómicas de alta dimensión en modelos predictivos clínicos, abordando problemas de colinealidad y direccionalidad de dependencias mediante algoritmos eficientes para la inferencia local y la descomposición global del rendimiento predictivo.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

Bayes with No Shame: Admissibility Geometries of Predictive Inference

El artículo demuestra que la optimalidad en la inferencia predictiva es irreductiblemente relativa al criterio, al probar que cuatro geometrías de admisibilidad distintas (Blackwell, válida en cualquier momento, de cobertura marginal y Cesàro) son mutuamente no anidadas y poseen certificados de optimología geométricamente incompatibles.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

On the Statistical Optimality of Optimal Decision Trees

Este trabajo establece una teoría estadística rigurosa para los árboles de decisión óptimos mediante minimización de riesgo empírico, demostrando que logran tasas minimax óptimas y desigualdades de oráculo afiladas al capturar características estructurales clave como la dispersión, la suavidad anisotrópica y la heterogeneidad espacial, incluso en escenarios de ruido pesado.

Zineng Xu, Subhroshekhar Ghosh, Yan Shuo Tan2026-03-06🔢 math

Harnessing Synthetic Data from Generative AI for Statistical Inference

Este artículo revisa el panorama actual de la generación y uso de datos sintéticos desde una perspectiva estadística, analizando los modelos generativos, sus limitaciones y riesgos, para proponer un marco principista que garantice la validez y fiabilidad de la inferencia estadística basada en estos datos.

Ahmad Abdel-Azim, Ruoyu Wang, Xihong Lin2026-03-06🤖 cs.LG

Thermodynamic Response Functions in Singular Bayesian Models

Este artículo establece un marco unificado que interpreta las funciones de respuesta termodinámica en modelos bayesianos singulares, vinculando conceptos como el umbral logarítmico real canónico y el fluctuación singular con observables termodinámicos para explicar la complejidad, la variabilidad predictiva y la reorganización estructural en el aprendizaje bayesiano.

Sean Plummer2026-03-06🔢 math

← Anterior Siguiente →