Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

Este estudio advierte que los explicadores post hoc como SHAP y LIME, aunque útiles para generar hipótesis exploratorias, no deben utilizarse para validar hipótesis en investigación empresarial debido a su falta de fiabilidad en la recuperación de relaciones causales reales, especialmente cuando existen correlaciones entre variables o el efecto Rashomon.

Tong Wang (Jeffrey), Ronilo Ragodos (Jeffrey), Lu Feng (Jeffrey), Yu (Jeffrey), Hu2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

Este artículo presenta una reevaluación rigurosa de la eficiencia energética de las redes neuronales de espigas (SNN) frente a las redes neuronales cuantizadas (QNN), demostrando mediante un modelo analítico detallado que las SNN solo superan a las QNN bajo condiciones específicas de hardware y parámetros operativos, como tasas de espiga bajas y ventanas temporales moderadas, lo que podría duplicar la vida útil de la batería en dispositivos como relojes inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Este artículo demuestra que, para una clase de procesos de decisión de Markov de horizonte finito con espacios generales de estado y acción, el paisaje de optimización de políticas satisface la condición PŁK, lo que garantiza la convergencia global de los métodos de gradiente de política a la política óptima con tasas no asintóticas y proporciona las primeras garantías de complejidad de muestra para sistemas de inventario y balances de efectivo estocásticos.

Xin Chen, Yifan Hu, Minda Zhao2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artículo presenta un marco de Ecuaciones Diferenciales con Retardo Neuronales (NDDEs) inspirado en el formalismo Mori-Zwanzig para aprender dinámicas no markovianas a partir de datos de sistemas parcialmente observables, demostrando un rendimiento superior frente a métodos existentes como las redes LSTM y las ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Este trabajo demuestra que los transformadores, mediante el aprendizaje en contexto, pueden inferir implícitamente estados ocultos para predecir con alta precisión la salida de sistemas dinámicos lineales y no lineales sin necesidad de actualizaciones de gradiente ni conocimiento explícito del modelo, rivalizando así con métodos de filtrado bayesiano tradicionales como el filtro de Kalman.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

A Learned Proximal Alternating Minimization Algorithm and Its Induced Network for a Class of Two-block Nonconvex and Nonsmooth Optimization

Este trabajo propone un algoritmo de minimización alternada proximal aprendida (LPAM) y su red neuronal asociada (LPAM-net) para resolver problemas de optimización no convexos y no suaves de dos bloques, garantizando la convergencia a puntos estacionarios de Clarke y demostrando su eficacia y eficiencia paramétrica en la reconstrucción de imágenes de resonancia magnética multimodal.

Yunmei Chen, Lezhi Liu, Lei Zhang2026-03-10🤖 cs.LG

Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging

Este estudio propone un sistema neurosimbólico que reconstruye imágenes mediante primitivas visuales para generar explicaciones estructurales de alto nivel, logrando una mayor precisión y transparencia que las arquitecturas de aprendizaje profundo convencionales en el diagnóstico de anomalías en imágenes histológicas.

Zuzanna Buchnajzer, Kacper Dobek, Stanisław Hapke, Daniel Jankowski, Krzysztof Krawiec2026-03-10🤖 cs.LG

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

Este estudio presenta una estrategia de optimización de tareas locomotoras que, mediante análisis de agrupamiento de características biomecánicas, identifica un conjunto mínimo de tareas representativas para entrenar modelos de aprendizaje profundo que estiman con precisión los momentos articulares de la cadera, reduciendo significativamente la carga de recolección de datos sin comprometer el rendimiento del control del exoesqueleto.

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG