Learning to See the Elephant in the Room: Self-Supervised Context Reasoning in Humans and AI

Este estudio combina experimentos psicológicos y modelado computacional para demostrar que tanto los humanos como el modelo SeCo pueden aprender rápidamente a inferir objetos ocultos a partir de relaciones contextuales en escenas naturales sin supervisión explícita, destacando la importancia de las asociaciones contextuales para la comprensión visual.

Xiao Liu, Soumick Sarker, Ankur Sikarwar + 4 more2026-02-24🤖 cs.AI

MathScape: Benchmarking Multimodal Large Language Models in Real-World Mathematical Contexts

El artículo presenta MathScape, un nuevo benchmark que evalúa la capacidad de razonamiento matemático de los modelos de lenguaje multimodal en contextos reales mediante imágenes capturadas por humanos, revelando que incluso los modelos más avanzados tienen dificultades significativas en estas tareas y que el rendimiento en datos sintéticos no garantiza éxito en escenarios del mundo real.

Hao Liang, Linzhuang Sun, Minxuan Zhou + 7 more2026-02-24💬 cs.CL

CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes

El artículo presenta CT-AGRG, un modelo que mejora la generación automática de informes médicos a partir de tomografías computarizadas torácicas 3D al priorizar la detección de anomalías específicas antes de redactar descripciones dirigidas, logrando así una mayor calidad y relevancia clínica en comparación con los métodos existentes.

Theo Di Piazza, Carole Lazarus, Olivier Nempont + 1 more2026-02-24⚡ eess

SAMRI-2: A Memory-based Model for Cartilage and Meniscus Segmentation in 3D MRIs of the Knee Joint

Este estudio presenta SAMRI-2, un modelo de visión fundacional basado en memoria que, mediante una estrategia de mezcla híbrida y propagación de máscaras, supera a otros enfoques de deep learning en la segmentación precisa y eficiente de cartílago y menisco en resonancias magnéticas 3D de la rodilla, reduciendo significativamente el esfuerzo de anotación y los errores morfométricos.

Danielle L. Ferreira, Bruno A. A. Nunes, Xuzhe Zhang + 3 more2026-02-24⚡ eess

Hier-COS: Making Deep Features Hierarchy-aware via Composition of Orthogonal Subspaces

Este artículo presenta Hier-COS, un marco novedoso que utiliza la composición de subespacios ortogonales para generar representaciones de características jerárquicamente conscientes y consistentes, superando las limitaciones de las métricas de evaluación existentes mediante la propuesta de HOPS y logrando un rendimiento superior en clasificación jerárquica y de granularidad fina.

Depanshu Sani, Saket Anand2026-02-24🤖 cs.LG

SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

El artículo presenta SpHOR, un enfoque de aprendizaje de representaciones que mejora el reconocimiento de conjunto abierto mediante el diseño de un espacio de características con embebidos de etiquetas ortogonales, restricciones esféricas y técnicas de regularización, logrando resultados de vanguardia en la identificación de clases desconocidas.

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge2026-02-24💻 cs