Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation

Este trabajo presenta FedMEPD, un marco de aprendizaje federado que aborda la heterogeneidad intermodal y la necesidad de personalización en la segmentación de tumores cerebrales mediante codificadores específicos por modalidad y un decodificador de fusión parcialmente personalizado que utiliza anclajes globales y atención cruzada para compensar la falta de modalidades en los clientes.

Hong Liu, Dong Wei, Qian Dai + 3 more2026-03-06💻 cs

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabajo propone un método de optimización de texturas adversarias para objetos 3D que, mediante renderizado diferenciable y estrategias como la expectativa sobre transformaciones y un currículo de lo grueso a lo fino, supera las limitaciones de los parches 2D al mantener su eficacia contra políticas visuomotoras bajo vistas dinámicas y distancias variables.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement

El artículo presenta BiEvLight, un marco de aprendizaje multinivel que optimiza conjuntamente la eliminación de ruido en eventos y la mejora de imágenes en condiciones de poca luz mediante un prior guiado por gradientes y una formulación de optimización jerárquica, logrando así superar a los métodos actuales en el conjunto de datos SDE.

Zishu Yao, Xiang-Xiang Su, Shengning Zhou + 3 more2026-03-06💻 cs

3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

El artículo presenta 3D-RFT, un marco pionero que aplica el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a la comprensión de escenas 3D basadas en video, optimizando directamente los modelos multimodales mediante funciones de recompensa derivadas de métricas de evaluación para lograr un rendimiento superior al estado del arte en tareas de percepción y razonamiento espacial.

Xiongkun Linghu, Jiangyong Huang, Baoxiong Jia + 1 more2026-03-06🤖 cs.AI

MultiGO++: Monocular 3D Clothed Human Reconstruction via Geometry-Texture Collaboration

El artículo presenta MultiGO++, un marco innovador para la reconstrucción 3D de humanos vestidos a partir de una sola imagen que supera las limitaciones de los métodos existentes mediante una colaboración efectiva entre geometría y textura, lograda a través de una síntesis de texturas multi-fuente, un módulo de extracción de forma consciente de regiones y una red de reconstrucción dual.

Nanjie Yao, Gangjian Zhang, Wenhao Shen + 3 more2026-03-06💻 cs

Physics-consistent deep learning for blind aberration recovery in mobile optics

Este trabajo presenta Lens2Zernike, un marco de aprendizaje profundo consistente con la física que recupera ciegamente parámetros ópticos a partir de una sola imagen borrosa mediante una estrategia de supervisión multi-tarea en tres dominios ópticos, logrando una recuperación de detalles difractivos superior a los métodos existentes.

Kartik Jhawar, Tamo Sancho Miguel Tandoc, Khoo Jun Xuan + 1 more2026-03-06💻 cs

How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices

Este trabajo presenta un estudio a gran escala sobre la Restauración de Imágenes Generativa (GIR) que, mediante una nueva evaluación multidimensional, revela un cambio de paradigma en los modos de fallo (de la escasez a la sobre-generación de detalles) y propone un nuevo modelo de calidad de imagen alineado con la percepción humana para guiar el desarrollo futuro del campo.

Xiang Yin, Jinfan Hu, Zhiyuan You + 4 more2026-03-06💻 cs