Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este trabajo presenta el Sistema de Análisis Multimodal de Video Laringoscópico (MLVAS), una herramienta innovadora que combina datos de audio y video mediante detección de glotis, refinamiento de segmentación basado en difusión y extracción de características acústicas y visuales para asistir en el diagnóstico objetivo y automatizado de la parálisis de las cuerdas vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

Reconsidering the energy efficiency of spiking neural networks

Este artículo presenta una reevaluación rigurosa de la eficiencia energética de las redes neuronales de espigas (SNN) frente a las redes neuronales cuantizadas (QNN), demostrando mediante un modelo analítico detallado que las SNN solo superan a las QNN bajo condiciones específicas de hardware y parámetros operativos, como tasas de espiga bajas y ventanas temporales moderadas, lo que podría duplicar la vida útil de la batería en dispositivos como relojes inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artículo presenta un marco de Ecuaciones Diferenciales con Retardo Neuronales (NDDEs) inspirado en el formalismo Mori-Zwanzig para aprender dinámicas no markovianas a partir de datos de sistemas parcialmente observables, demostrando un rendimiento superior frente a métodos existentes como las redes LSTM y las ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

The Illusion of Collusion

Este estudio demuestra que los agentes algorítmicos que utilizan aprendizaje por refuerzo sin conocimiento previo de la estructura del juego pueden desarrollar una "colusión ingenua" basada en la sincronización de sus acciones, un fenómeno cuya probabilidad de ocurrencia depende críticamente de la política de comportamiento específica (estocástica, determinista o híbrida) que empleen los algoritmos.

Connor Douglas, Foster Provost, Arun Sundararajan2026-03-10💻 cs

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Este artículo propone un diseño conjunto de los factores de sensado, comunicación y velocidad de exploración para optimizar la eficiencia energética en la localización y mapeo simultáneos (SLAM) de robots móviles a lo largo de su vida útil, transmitiendo datos a un centro en la nube para la reconstrucción de mapas mediante aprendizaje profundo.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models

El artículo presenta HarmonicEval, una métrica de evaluación automática sin referencia que genera puntuaciones integrales y por criterio mediante un enfoque ascendente, y introduce el benchmark MMHE con 18.000 juicios humanos para demostrar su superior correlación con la evaluación humana en escenarios multimodales y multitarea.

Masanari Ohi, Masahiro Kaneko, Naoaki Okazaki, Nakamasa Inoue2026-03-10💬 cs.CL

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este trabajo presenta un método que utiliza modelos de visión y lenguaje preentrenados para aprender modelos de mundo simbólicos a partir de demostraciones cortas, permitiendo a los robots generalizar de forma cero-shot y resolver problemas de toma de decisiones a largo plazo en entornos complejos mediante planificación.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

El artículo presenta Prompt-SID, un marco de aprendizaje auto-supervisado para la eliminación de ruido en imágenes individuales que preserva los detalles estructurales mediante un modelo de difusión latente para generar prompts estructurales y un mecanismo de repetición de escala para mitigar las diferencias de resolución.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs