Addressing Camera Sensors Faults in Vision-Based Navigation: Simulation and Dataset Development

Este estudio aborda la falta de datos de fallos en sensores para la navegación basada en visión en misiones espaciales mediante el desarrollo de un marco de simulación que genera un conjunto de datos sintéticos de imágenes defectuosas para entrenar y probar algoritmos de inteligencia artificial destinados a la detección de fallos.

Riccardo Gallon, Fabian Schiemenz, Alessandra Menicucci + 1 more2026-02-25🤖 cs.AI

NRSeg: Noise-Resilient Learning for BEV Semantic Segmentation via Driving World Models

El artículo presenta NRSeg, un marco de aprendizaje resiliente al ruido que mejora la segmentación semántica en vista aérea (BEV) mediante el uso de datos sintéticos de modelos del mundo de conducción, incorporando métricas de consistencia geométrica, predicción paralela de distribuciones y exclusión semántica local jerárquica para lograr un rendimiento de vanguardia en tareas no supervisadas y semi-supervisadas.

Siyu Li, Fei Teng, Yihong Cao + 3 more2026-02-25⚡ eess

FedGIN: Federated Learning with Dynamic Global Intensity Non-linear Augmentation for Organ Segmentation using Multi-modal Images

El artículo presenta FedGIN, un marco de aprendizaje federado que utiliza una augmentación no lineal dinámica de intensidad global para mejorar la segmentación de órganos en imágenes multimodales (MRI y CT) sin compartir datos privados, logrando significativas mejoras en el rendimiento y la generalización entre modalidades.

Sachin Dudda Nagaraju, Ashkan Moradi, Bendik Skarre Abrahamsen + 1 more2026-02-25🤖 cs.AI

Seeing Through the Noise: Improving Infrared Small Target Detection and Segmentation from Noise Suppression Perspective

Este artículo presenta la NS-FPN, una red de pirámide de características que mejora la detección y segmentación de objetivos pequeños en infrarrojos mediante la supresión de ruido en el dominio de la frecuencia, logrando así una reducción significativa de las falsas alarmas en comparación con los métodos basados en CNN.

Maoxun Yuan, Duanni Meng, Ziteng Xi + 4 more2026-02-25🤖 cs.AI

PaCo-FR: Patch-Pixel Aligned End-to-End Codebook Learning for Facial Representation Pre-training

El artículo presenta PaCo-FR, un marco de pre-entrenamiento no supervisado que combina el modelado de imágenes enmascaradas con la alineación parche-píxel mediante estrategias de enmascaramiento estructurado, un código de parches novedoso y restricciones de consistencia espacial para lograr un rendimiento superior en tareas de análisis facial con datos limitados.

Yin Xie, Zhichao Chen, Zeyu Xiao + 7 more2026-02-25💻 cs

Decouple, Reorganize, and Fuse: A Multimodal Framework for Cancer Survival Prediction

Este trabajo presenta DeReF, un nuevo marco multimodal para la predicción de supervivencia del cáncer que supera las limitaciones de los métodos existentes mediante una estrategia de reorganización aleatoria de características y un módulo de fusión dinámica basado en expertos, mejorando así la generalización y la interacción de información entre modalidades en conjuntos de datos de cáncer de hígado y TCGA.

Huayi Wang, Haochao Ying, Yuyang Xu + 5 more2026-02-25💻 cs

Learning Unified Representations from Heterogeneous Data for Robust Heart Rate Modeling

Este artículo presenta un marco innovador que aprende representaciones unificadas para modelar la frecuencia cardíaca de manera robusta ante la heterogeneidad de datos, abordando tanto las diferencias entre dispositivos como las variaciones fisiológicas individuales mediante estrategias como el dropout aleatorio de características, la atención consciente del historial y el aprendizaje contrastivo, lo que se valida mediante un nuevo conjunto de datos (PARROTAO) y mejoras significativas en el rendimiento frente a métodos existentes.

Zhengdong Huang, Zicheng Xie, Wentao Tian + 3 more2026-02-25🤖 cs.LG

EHWGesture -- A dataset for multimodal understanding of clinical gestures

Este artículo presenta EHWGesture, un nuevo conjunto de datos multimodal que incluye grabaciones de video RGB-D y de eventos con seguimiento preciso de landmarks, diseñado para avanzar en la comprensión de gestos clínicos, la detección de activación y la evaluación de la calidad de la ejecución mediante cinco gestos relevantes capturados de 25 sujetos.

Gianluca Amprimo, Alberto Ancilotto, Alessandro Savino + 5 more2026-02-25🤖 cs.AI