Demographic-aware fine-grained visual recognition of pediatric wrist pathologies

Este artículo propone un modelo híbrido de convolución-transformer consciente de la demografía, que combina radiografías de muñeca con la edad y el sexo del paciente mediante enmascaramiento progresivo de metadatos, para mejorar el reconocimiento de patologías pediátricas al abordar la variabilidad anatómica normal y demostrar que la inicialización con preentrenamiento en datos de granularidad fina supera a los enfoques tradicionales.

Ammar Ahmed, Ali Shariq Imran, Zenun Kastrati + 1 more2026-02-20🤖 cs.AI

Bongard-RWR+: Real-World Representations of Fine-Grained Concepts in Bongard Problems

Este trabajo presenta Bongard-RWR+, un conjunto de datos ampliado de 5.400 instancias que utiliza imágenes generadas por modelos de lenguaje visuales para representar conceptos abstractos de problemas Bongard en escenarios realistas, demostrando que, aunque los modelos actuales reconocen conceptos visuales generales, siguen teniendo dificultades significativas para discernir conceptos finos y realizar razonamiento abstracto.

Szymon Pawlonka, Mikołaj Małkiński, Jacek Mańdziuk2026-02-20🤖 cs.AI

Point Linguist Model: Segment Any Object via Bridged Large 3D-Language Model

El modelo Point Linguist (PLM) es un marco general que supera la desalineación entre los grandes modelos de lenguaje y las nubes de puntos 3D mediante la introducción de representaciones discriminativas centradas en objetos y un decodificador de reactivación geométrica, logrando así una segmentación de objetos precisa y robusta sin necesidad de pre-alineación a gran escala.

Zhuoxu Huang, Mingqi Gao, Jungong Han2026-02-20💻 cs

Anomaly-Aware YOLO: A Frugal yet Robust Approach to Infrared Small Target Detection

El artículo presenta AA-YOLO, un enfoque frugal y robusto que integra una prueba estadística de detección de anomalías en el cabezal de detección de YOLO para mejorar la identificación de objetivos pequeños en imágenes infrarrojas, reduciendo las falsas alarmas y manteniendo un alto rendimiento incluso con datos limitados o en modelos ligeros.

Alina Ciocarlan, Sylvie Le Hégarat-Mascle, Sidonie Lefebvre2026-02-20💻 cs

Improving segmentation of retinal arteries and veins using cardiac signal in doppler holograms

Este trabajo propone un método eficaz para la segmentación de arterias y venas retinianas en hologramas Doppler que, al integrar características de la señal cardíaca en arquitecturas estándar como U-Net, logra un rendimiento comparable a modelos complejos y desbloquea el potencial del aprendizaje profundo para el análisis cuantitativo de la hemodinámica retiniana.

Marius Dubosc, Yann Fischer, Zacharie Auray + 4 more2026-02-20🤖 cs.AI

INQUIRE-Search: Interactive Discovery in Large-Scale Biodiversity Databases

El artículo presenta INQUIRE-Search, un sistema de código abierto que utiliza lenguaje natural para permitir a los científicos buscar, verificar y analizar fenómenos ecológicos complejos en grandes bases de datos de imágenes de biodiversidad como iNaturalist, logrando una eficiencia de descubrimiento significativamente superior a la inspección manual y estableciendo un nuevo paradigma para la investigación científica escalable.

Edward Vendrow, Julia Chae, Rupa Kurinchi-Vendhan + 10 more2026-02-20💻 cs

Restrictive Hierarchical Semantic Segmentation for Stratified Tooth Layer Detection

Este trabajo presenta un marco general de segmentación semántica jerárquica y restrictiva que integra explícitamente la anatomía dental mediante predicción recurrente y condicionamiento de características, logrando una detección más precisa y clínicamente coherente de las capas de los dientes en radiografías panorámicas, especialmente en escenarios con datos limitados.

Ryan Banks, Camila Lindoni Azevedo, Hongying Tang + 1 more2026-02-20🤖 cs.AI