PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

El artículo presenta PathMem, un marco multimodal centrado en la memoria que imita el proceso cognitivo humano para integrar conocimientos estructurados de patología en modelos MLLM, logrando un rendimiento superior en la generación de informes y diagnósticos mediante una transformación de memoria alineada con la cognición.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang LiuWed, 11 Ma🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

El artículo presenta k-MTR, un marco de aprendizaje de representaciones en el espacio k que alinea datos submuestreados directamente con etiquetas fisiológicas en un espacio latente compartido, superando la necesidad de reconstruir imágenes intermedias para lograr un análisis cardíaco multi-tarea preciso y eficiente.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen PanWed, 11 Ma🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artículo establece que la abstención basada en la confianza mejora monótonamente la calidad de las decisiones solo bajo condiciones específicas de alineación de rangos y ausencia de zonas de inversión, demostrando empíricamente que mientras la incertidumbre estructural respeta estas condiciones, la incertidumbre contextual (como la deriva temporal) las viola frecuentemente, lo que requiere señales de confianza adaptadas al tipo de incertidumbre dominante antes de implementar sistemas de decisión clasificados.

Ronald DokuWed, 11 Ma🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artículo presenta el Indicador de Sobreajuste-Subajuste (OUI) como una señal estructural temprana y eficiente que, al analizar los patrones de activación de las neuronas en PPO, permite discriminar con precisión entre tasas de aprendizaje óptimas e inestables mucho antes de completar el entrenamiento, diferenciando además los comportamientos ideales de las redes actor y crítico.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-OrtíWed, 11 Ma🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

El artículo presenta BEACON, un método que mejora la navegación guiada por lenguaje en entornos con oclusiones al predecir mapas de calor de viabilidad en vista cenital (BEV) que incluyen áreas ocultas, superando significativamente a los enfoques basados en imágenes al integrar un modelo de lenguaje visual con características de profundidad derivadas de observaciones multivista.

Xinyu Gao, Gang Chen, Javier Alonso-MoraWed, 11 Ma🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Este estudio presenta un guía impulsado por un modelo de lenguaje grande (LLM) para mejorar la accesibilidad en realidad virtual para personas ciegas o con baja visión, revelando que los usuarios lo perciben como una herramienta cuando están solos pero como un compañero social en entornos grupales, lo que genera recomendaciones de diseño para futuras interacciones.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri AzenkotWed, 11 Ma🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artículo demuestra que, en escenarios realistas con características correlacionadas, la superposición en redes neuronales puede aprovechar la interferencia constructiva mediante la organización de características según sus patrones de co-activación, lo que genera estructuras semánticas y cíclicas que no se explican mediante el modelo tradicional de superposición basado en características no correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. MedianoWed, 11 Ma🤖 cs.AI

Explainable classification of astronomical uncertain time series

Este trabajo propone un modelo de clasificación basado en subsecuencias que incorpora la incertidumbre de los datos como entrada adicional y ofrece explicabilidad por diseño, logrando un rendimiento comparable a los métodos de vanguardia para el análisis de series temporales astronómicas inciertas.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)Tue, 10 Ma🔭 astro-ph

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artículo presenta una encuesta centrada en el aprendizaje automático sobre la Prueba Adaptativa Computarizada (CAT), explorando cómo las técnicas de ML pueden optimizar sus componentes clave para crear sistemas más robustos, justos y eficientes que integren la psicometría tradicional con enfoques interdisciplinarios.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artículo identifica y explica la etapa de corrupción en el ajuste fino de pocos ejemplos de modelos de difusión, proponiendo el uso de redes neuronales bayesianas para mitigar este fenómeno y mejorar la fidelidad, calidad y diversidad de las imágenes generadas sin incurrir en costos adicionales de inferencia.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing GuanTue, 10 Ma🤖 cs.LG