Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artículo presenta DAPL, un marco de aprendizaje de políticas consciente de la dinámica que facilita la destreza extrínseca en entornos desordenados mediante la modelización explícita de las interacciones de contacto, logrando un rendimiento superior al de métodos existentes tanto en simulación como en aplicaciones del mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

El artículo presenta MedMASLab, un marco unificado y plataforma de evaluación que aborda la fragmentación arquitectónica en los sistemas de agentes médicos multimodales mediante un protocolo de comunicación estandarizado, un evaluador de razonamiento clínico automatizado y el benchmark más extenso hasta la fecha, revelando brechas críticas de rendimiento al transitar entre subdominios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Este artículo presenta un enfoque basado en inteligencia artificial y aprendizaje automático que utiliza datos de licencias y crowdsourcing para estimar con precisión la demanda de espectro en cinco ciudades canadienses, logrando un coeficiente de determinación de 0,89 y ayudando a los reguladores a optimizar la planificación y asignación de recursos espectrales.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

El artículo presenta ACADiff, un marco de difusión latente adaptativo y consciente de datos clínicos que sintetiza modalidades de neuroimagen cerebrales faltantes y mejora el diagnóstico de Alzheimer incluso en escenarios con hasta un 80% de datos ausentes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

El artículo presenta PathMem, un marco multimodal centrado en la memoria que imita el proceso cognitivo humano para integrar conocimientos estructurados de patología en modelos MLLM, logrando un rendimiento superior en la generación de informes y diagnósticos mediante una transformación de memoria alineada con la cognición.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

El artículo presenta k-MTR, un marco de aprendizaje de representaciones en el espacio k que alinea datos submuestreados directamente con etiquetas fisiológicas en un espacio latente compartido, superando la necesidad de reconstruir imágenes intermedias para lograr un análisis cardíaco multi-tarea preciso y eficiente.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artículo establece que la abstención basada en la confianza mejora monótonamente la calidad de las decisiones solo bajo condiciones específicas de alineación de rangos y ausencia de zonas de inversión, demostrando empíricamente que mientras la incertidumbre estructural respeta estas condiciones, la incertidumbre contextual (como la deriva temporal) las viola frecuentemente, lo que requiere señales de confianza adaptadas al tipo de incertidumbre dominante antes de implementar sistemas de decisión clasificados.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artículo presenta el Indicador de Sobreajuste-Subajuste (OUI) como una señal estructural temprana y eficiente que, al analizar los patrones de activación de las neuronas en PPO, permite discriminar con precisión entre tasas de aprendizaje óptimas e inestables mucho antes de completar el entrenamiento, diferenciando además los comportamientos ideales de las redes actor y crítico.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

El artículo presenta BEACON, un método que mejora la navegación guiada por lenguaje en entornos con oclusiones al predecir mapas de calor de viabilidad en vista cenital (BEV) que incluyen áreas ocultas, superando significativamente a los enfoques basados en imágenes al integrar un modelo de lenguaje visual con características de profundidad derivadas de observaciones multivista.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Este estudio presenta un guía impulsado por un modelo de lenguaje grande (LLM) para mejorar la accesibilidad en realidad virtual para personas ciegas o con baja visión, revelando que los usuarios lo perciben como una herramienta cuando están solos pero como un compañero social en entornos grupales, lo que genera recomendaciones de diseño para futuras interacciones.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artículo demuestra que, en escenarios realistas con características correlacionadas, la superposición en redes neuronales puede aprovechar la interferencia constructiva mediante la organización de características según sus patrones de co-activación, lo que genera estructuras semánticas y cíclicas que no se explican mediante el modelo tradicional de superposición basado en características no correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI