Velocity and stroke rate reconstruction of canoe sprint team boats based on panned and zoomed video recordings

Este artículo presenta un marco automatizado que reconstruye con alta precisión la velocidad y la frecuencia de remada de canoas de sprint a partir de grabaciones de video con panorámica y zoom, utilizando detección de objetos, calibración de homografía y seguimiento óptico para ofrecer a los entrenadores una alternativa viable a los sistemas GPS.

Julian Ziegler, Daniel Matthes, Finn Gerdts + 5 more2026-02-27💻 cs

MM-NeuroOnco: A Multimodal Benchmark and Instruction Dataset for MRI-Based Brain Tumor Diagnosis

Este trabajo presenta MM-NeuroOnco, un conjunto de datos de instrucciones multimodales a gran escala y una evaluación de referencia para el diagnóstico de tumores cerebrales mediante resonancia magnética, que demuestra mediante el modelo NeuroOnco-GPT cómo el ajuste fino con estos datos mejora significativamente el razonamiento diagnóstico clínico.

Feng Guo, Jiaxiang Liu, Yang Li + 2 more2026-02-27🤖 cs.AI

Can Agents Distinguish Visually Hard-to-Separate Diseases in a Zero-Shot Setting? A Pilot Study

Este estudio piloto evalúa el rendimiento de agentes multimodales en un entorno de cero disparos para distinguir enfermedades visualmente similares, demostrando que un marco de adjudicación contrastiva mejora la precisión y reduce afirmaciones infundadas, aunque el desempeño aún no es suficiente para su implementación clínica.

Zihao Zhao, Frederik Hauke, Juliana De Castilhos + 2 more2026-02-27💻 cs

An automatic counting algorithm for the quantification and uncertainty analysis of the number of microglial cells trainable in small and heterogeneous datasets

Este trabajo presenta un algoritmo automático no paramétrico basado en un contador de kernels que cuantifica el número de células microgliales en imágenes de alta resolución de ratas, permitiendo su entrenamiento en conjuntos de datos pequeños y heterogéneos mientras ofrece estimaciones de incertidumbre y maneja múltiples opiniones de expertos.

L. Martino, M. M. Garcia, P. S. Paradas + 1 more2026-02-27⚡ eess

SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling

SubspaceAD es un método libre de entrenamiento para la detección de anomalías en pocos ejemplos que, mediante la proyección de características de un modelo DINOv2 congelado en un subespacio normal estimado con PCA, logra un rendimiento de vanguardia en la detección de anomalías industriales sin necesidad de bancos de memoria, ajuste de prompts o conjuntos de datos auxiliares.

Camile Lendering, Erkut Akdag, Egor Bondarev2026-02-27🤖 cs.LG

Small Object Detection Model with Spatial Laplacian Pyramid Attention and Multi-Scale Features Enhancement in Aerial Images

Este artículo propone un modelo de detección de objetos pequeños en imágenes aéreas que integra una Atención de Pirámide Laplaciana Espacial y una Mejora de Características Multiescala con convoluciones deformables para superar los desafíos de tamaño reducido y distribución densa, logrando un rendimiento superior en los conjuntos de datos VisDrone y DOTA.

Zhangjian Ji, Huijia Yan, Shaotong Qiao + 2 more2026-02-27💻 cs

D-FINE-seg: Object Detection and Instance Segmentation Framework with multi-backend deployment

El artículo presenta D-FINE-seg, una extensión de detección de instancias para D-FINE que incorpora un cabezal de máscara ligero y supervisión mejorada, superando a YOLO26 en precisión en el conjunto de datos TACO bajo un protocolo TensorRT FP16 unificado y ofreciendo un pipeline de código abierto para la implementación multiplataforma en ONNX, TensorRT y OpenVINO.

Argo Saakyan, Dmitry Solntsev2026-02-27💻 cs

Align then Adapt: Rethinking Parameter-Efficient Transfer Learning in 4D Perception

El artículo presenta PointATA, un nuevo paradigma de transferencia de aprendizaje eficiente en parámetros que supera las limitaciones de adaptación de modelos 3D preentrenados a tareas de percepción 4D mediante un enfoque de dos etapas ("Alinear luego Adaptar") que cierra la brecha modal y mitiga el sobreajuste, logrando un rendimiento superior o comparable al ajuste completo con una fracción de los parámetros.

Yiding Sun, Jihua Zhu, Haozhe Cheng + 4 more2026-02-27💻 cs

Cytoarchitecture in Words: Weakly Supervised Vision-Language Modeling for Human Brain Microscopy

Este artículo presenta un método de aprendizaje débilmente supervisado que vincula modelos de visión y lenguaje mediante etiquetas para generar descripciones en lenguaje natural de la citoarquitectura del cerebro humano a partir de imágenes de microscopía, superando así la escasez de datos emparejados imagen-texto en este dominio.

Matthew Sutton, Katrin Amunts, Timo Dickscheid + 1 more2026-02-27💻 cs

Locally Adaptive Decay Surfaces for High-Speed Face and Landmark Detection with Event Cameras

Este artículo presenta las Superficies de Decaimiento Adaptativo Local (LADS), una nueva representación para cámaras de eventos que modula dinámicamente el decaimiento temporal según la actividad local, logrando un rendimiento superior en la detección de rostros y puntos de referencia faciales a altas frecuencias en comparación con los métodos existentes.

Paul Kielty, Timothy Hanley, Peter Corcoran2026-02-27💻 cs

SpectralMamba-UNet: Frequency-Disentangled State Space Modeling for Texture-Structure Consistent Medical Image Segmentation

El artículo presenta SpectralMamba-UNet, un marco innovador que descompone las características en el dominio de la frecuencia para modelar de manera eficiente tanto las estructuras anatómicas globales como los detalles de los bordes, mejorando así la segmentación de imágenes médicas mediante la integración de modelos de espacio de estado con transformadas espectrales.

Fuhao Zhang, Lei Liu, Jialin Zhang + 2 more2026-02-27💻 cs

From Calibration to Refinement: Seeking Certainty via Probabilistic Evidence Propagation for Noisy-Label Person Re-Identification

El artículo presenta CARE, un marco de dos etapas que aborda la identificación de personas con etiquetas ruidosas mediante la calibración de evidencia probabilística para eliminar la sobreconfianza del softmax y un refinamiento basado en márgenes angulares compuestos que preserva las muestras positivas difíciles mientras descarta las etiquetas incorrectas.

Xin Yuan, Zhiyong Zhang, Xin Xu + 2 more2026-02-27💻 cs