Automated Re-Identification of Holstein-Friesian Cattle in Dense Crowds

Este artículo presenta un nuevo pipeline de detección-segmentación-identificación que, combinado con aprendizaje contrastivo no supervisado y un nuevo conjunto de datos de granjas lecheras, logra una precisión del 98,93% en la detección y del 94,82% en la reidentificación de vacas Holstein-Friesian en multitudes densas, superando significativamente a los métodos actuales.

Phoenix Yu, Tilo Burghardt, Andrew W Dowsey + 1 more2026-02-19💻 cs

Non-Contact Physiological Monitoring in Pediatric Intensive Care Units via Adaptive Masking and Self-Supervised Learning

Este trabajo presenta un marco de aprendizaje auto-supervisado basado en VisionMamba y un mecanismo de enmascaramiento adaptativo que, mediante una estrategia curricular y destilación de conocimiento, logra estimar con alta precisión la frecuencia cardíaca en unidades de cuidados intensivos pediátricos sin contacto, superando significativamente a los métodos existentes al reducir el error medio absoluto a 3.2 lpm.

Mohamed Khalil Ben Salah, Philippe Jouvet, Rita Noumeir2026-02-19💻 cs

MedProbCLIP: Probabilistic Adaptation of Vision-Language Foundation Model for Reliable Radiograph-Report Retrieval

MedProbCLIP es un marco de aprendizaje probabilístico que adapta modelos de visión y lenguaje para mejorar la fiabilidad y la seguridad en la recuperación de radiografías y sus informes clínicos mediante la representación de incertidumbre y correspondencias muchos-a-muchos, superando a los métodos deterministas en precisión, calibración y robustez.

Ahmad Elallaf, Yu Zhang, Yuktha Priya Masupalli + 4 more2026-02-19🤖 cs.AI

IRIS: Intent Resolution via Inference-time Saccades for Open-Ended VQA in Large Vision-Language Models

El artículo presenta IRIS, un enfoque sin entrenamiento que utiliza datos de seguimiento ocular en tiempo real para resolver ambigüedades en preguntas abiertas sobre imágenes, logrando duplicar la precisión de los modelos de visión y lenguaje grandes al identificar que las fijaciones cercanas al inicio de la pregunta son las más informativas.

Parsa Madinei, Srijita Karmakar, Russell Cohen Hoffing + 2 more2026-02-19💻 cs

EasyControlEdge: A Foundation-Model Fine-Tuning for Edge Detection

El artículo presenta EasyControlEdge, un enfoque que adapta modelos fundacionales de generación de imágenes para la detección de bordes mediante una pérdida especializada en el espacio de píxeles y una guía condicional, logrando así mapas de bordes nítidos y eficientes en datos que superan a los métodos actuales en diversas tareas de visión por computadora.

Hiroki Nakamura, Hiroto Iino, Masashi Okada + 1 more2026-02-19💻 cs

Subtractive Modulative Network with Learnable Periodic Activations

El artículo presenta la Red Modulativa Sustractiva (SMN), una arquitectura de representación neuronal implícita eficiente en parámetros inspirada en la síntesis sustractiva que utiliza una capa de activación periódica aprendible y módulos de máscara modulativa para lograr un rendimiento superior en tareas de reconstrucción de imágenes y síntesis de vistas nuevas en NeRF 3D.

Tiou Wang, Zhuoqian Yang, Markus Flierl + 2 more2026-02-19🤖 cs.LG

SCAR: Satellite Imagery-Based Calibration for Aerial Recordings

El artículo presenta SCAR, un método de auto-calibración a largo plazo para sistemas visuales-inerciales aéreos que utiliza imágenes satelitales georreferenciadas como referencia global para corregir la degradación de parámetros intrínsecos y extrínsecos sin intervención manual, demostrando una precisión superior en diversas campañas aéreas en comparación con enfoques existentes.

Henry Hölzemann, Michael Schleiss2026-02-19💻 cs