BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

El artículo presenta BEACON, un método que mejora la navegación guiada por lenguaje en entornos con oclusiones al predecir mapas de calor de viabilidad en vista cenital (BEV) que incluyen áreas ocultas, superando significativamente a los enfoques basados en imágenes al integrar un modelo de lenguaje visual con características de profundidad derivadas de observaciones multivista.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Este estudio presenta un guía impulsado por un modelo de lenguaje grande (LLM) para mejorar la accesibilidad en realidad virtual para personas ciegas o con baja visión, revelando que los usuarios lo perciben como una herramienta cuando están solos pero como un compañero social en entornos grupales, lo que genera recomendaciones de diseño para futuras interacciones.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artículo demuestra que, en escenarios realistas con características correlacionadas, la superposición en redes neuronales puede aprovechar la interferencia constructiva mediante la organización de características según sus patrones de co-activación, lo que genera estructuras semánticas y cíclicas que no se explican mediante el modelo tradicional de superposición basado en características no correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Explainable classification of astronomical uncertain time series

Este trabajo propone un modelo de clasificación basado en subsecuencias que incorpora la incertidumbre de los datos como entrada adicional y ofrece explicabilidad por diseño, logrando un rendimiento comparable a los métodos de vanguardia para el análisis de series temporales astronómicas inciertas.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artículo presenta una encuesta centrada en el aprendizaje automático sobre la Prueba Adaptativa Computarizada (CAT), explorando cómo las técnicas de ML pueden optimizar sus componentes clave para crear sistemas más robustos, justos y eficientes que integren la psicometría tradicional con enfoques interdisciplinarios.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artículo identifica y explica la etapa de corrupción en el ajuste fino de pocos ejemplos de modelos de difusión, proponiendo el uso de redes neuronales bayesianas para mitigar este fenómeno y mejorar la fidelidad, calidad y diversidad de las imágenes generadas sin incurrir en costos adicionales de inferencia.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este trabajo presenta el Sistema de Análisis Multimodal de Video Laringoscópico (MLVAS), una herramienta innovadora que combina datos de audio y video mediante detección de glotis, refinamiento de segmentación basado en difusión y extracción de características acústicas y visuales para asistir en el diagnóstico objetivo y automatizado de la parálisis de las cuerdas vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs