Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Este artículo propone un método de regularización direccional en el espacio latente que mitiga el aprendizaje de atajos y mejora la generalización fuera de distribución al identificar ejes correlacionados con etiquetas y reducir la sensibilidad del clasificador hacia ellos mediante la inyección de ruido anisotrópico, sin requerir etiquetas de atajos ni ejemplos conflictivos.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Este artículo demuestra que la participación de la comunidad de ciencia de datos a través de una competencia de Kaggle para desarrollar parametrizaciones de aprendizaje automático ha permitido lograr estabilidad en línea en simulaciones climáticas híbridas, superando obstáculos históricos y alcanzando resultados de vanguardia.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Este estudio presenta ForamDeepSlice, un marco de aprendizaje profundo basado en un ensemble de redes neuronales convolucionales que logra una precisión del 95,64% en la clasificación automática de especies de foraminíferos a partir de rebanadas 2D de micro-TC, ofreciendo además una herramienta interactiva para su despliegue práctico en geociencias.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

El artículo presenta AltNet, un enfoque basado en redes gemelas que resuelve el dilema de plasticidad-estabilidad en el aprendizaje por refuerzo al permitir la restauración periódica de la plasticidad mediante el intercambio de roles entre dos redes, logrando así una mayor eficiencia y rendimiento sin sufrir caídas temporales en el desempeño.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

El artículo presenta MSPT, un transformador de parches multi-escala que utiliza árboles de bolas para dividir dominios irregulares en parches, permitiendo modelar física a gran escala con millones de puntos en una sola GPU mediante una atención local y global eficiente que supera el estado del arte en precisión y eficiencia computacional.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

El artículo presenta GoRL, un marco de aprendizaje por refuerzo en línea que resuelve la tensión entre la estabilidad de la optimización y la expresividad de las políticas mediante la decouplaje de la optimización en un espacio latente tratable y la síntesis de acciones en un espacio generativo, logrando un rendimiento superior en tareas de control continuo.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Este artículo presenta la Regresión Isotónica Shapley Escasa (SISR), un marco unificado de explicación no lineal que aprende simultáneamente una transformación monótona para restaurar la aditividad y aplica una restricción de escasez L0 para identificar características relevantes de manera eficiente, superando así las limitaciones de distorsión y costo computacional de los valores Shapley estándar en escenarios de alta dimensionalidad y dependencias complejas.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Este trabajo propone un marco de aumento de datos generativo de dos pasos que combina deformación de máscaras basada en reglas y traducción de imágenes mediante GANs para generar muestras de rostros con mascarilla, logrando mejoras consistentes con una fracción mínima de los datos de entrenamiento utilizados por métodos anteriores, a pesar de haber sido desarrollado bajo severas restricciones de recursos y tiempo.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

El artículo presenta "Re-Depth Anything", un marco de auto-supervisión en tiempo de prueba que mejora la estimación de profundidad monoculosa al fusionar modelos fundacionales con priores de modelos de difusión 2D a gran escala mediante un refinamiento basado en re-iluminación y muestreo de distorsión de puntuación (SDS), logrando resultados de vanguardia sin necesidad de etiquetas.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Este artículo presenta tres estrategias complementarias para acelerar el entrenamiento de redes Kolmogorov-Arnold (KAN) basadas en el método Newton-Kaczmarz: un procedimiento de preentrenamiento, el entrenamiento en subconjuntos de datos disjuntos con fusión posterior de modelos y una técnica de paralelización implementada y validada en hardware FPGA.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG