SAMRI-2: A Memory-based Model for Cartilage and Meniscus Segmentation in 3D MRIs of the Knee Joint

Este estudio presenta SAMRI-2, un modelo de visión fundacional basado en memoria que, mediante una estrategia de mezcla híbrida y propagación de máscaras, supera a otros enfoques de deep learning en la segmentación precisa y eficiente de cartílago y menisco en resonancias magnéticas 3D de la rodilla, reduciendo significativamente el esfuerzo de anotación y los errores morfométricos.

Danielle L. Ferreira, Bruno A. A. Nunes, Xuzhe Zhang + 3 more2026-02-24⚡ eess

Hier-COS: Making Deep Features Hierarchy-aware via Composition of Orthogonal Subspaces

Este artículo presenta Hier-COS, un marco novedoso que utiliza la composición de subespacios ortogonales para generar representaciones de características jerárquicamente conscientes y consistentes, superando las limitaciones de las métricas de evaluación existentes mediante la propuesta de HOPS y logrando un rendimiento superior en clasificación jerárquica y de granularidad fina.

Depanshu Sani, Saket Anand2026-02-24🤖 cs.LG

SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

El artículo presenta SpHOR, un enfoque de aprendizaje de representaciones que mejora el reconocimiento de conjunto abierto mediante el diseño de un espacio de características con embebidos de etiquetas ortogonales, restricciones esféricas y técnicas de regularización, logrando resultados de vanguardia en la identificación de clases desconocidas.

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge2026-02-24💻 cs

Can Vision-Language Models Answer Face to Face Questions in the Real-World?

Este trabajo introduce el conjunto de datos y punto de referencia Qualcomm Interactive Video Dataset (IVD) para evaluar la capacidad de los modelos de visión-idioma para responder preguntas en tiempo real sobre escenas del mundo real, demostrando que, aunque los modelos actuales están muy por detrás del rendimiento humano, el ajuste fino puede reducir significativamente esta brecha en muchas habilidades perceptivas.

Reza Pourreza, Rishit Dagli, Apratim Bhattacharyya + 3 more2026-02-24💻 cs

Learn by Reasoning: Analogical Weight Generation for Few-Shot Class-Incremental Learning

Este trabajo propone un método de generación de pesos analógicos inspirado en el cerebro, denominado BiAG, que permite el aprendizaje incremental de pocas clases sin ajuste fino de parámetros al derivar pesos de nuevas clases a partir de conocimientos previos mediante mecanismos de atención y conversión semántica, logrando así un rendimiento superior en conjuntos de datos como miniImageNet, CUB-200 y CIFAR-100.

Jizhou Han, Chenhao Ding, Yuhang He + 4 more2026-02-24🤖 cs.AI

nnLandmark: A Self-Configuring Method for 3D Medical Landmark Detection

El artículo presenta nnLandmark, un marco de trabajo autoconfigurable que combina componentes de nnU-Net para lograr un rendimiento de vanguardia en la detección de puntos de referencia médicos 3D, ofreciendo una solución lista para usar que elimina la necesidad de ajuste manual de hiperparámetros y establece un estándar unificado para la evaluación y comparación de métodos en este campo.

Alexandra Ertl, Stefan Denner, Robin Peretzke + 8 more2026-02-24💻 cs