Diffusion-Based sRGB Real Noise Generation via Prompt-Driven Noise Representation Learning

Este artículo presenta un marco llamado Generación de Ruido Impulsada por Prompts (PNG) que utiliza representaciones de ruido de alto nivel basadas en prompts para sintetizar imágenes ruidosas realistas en el espacio sRGB sin depender de metadatos de cámara, mejorando así la generalización y aplicabilidad en la eliminación de ruido del mundo real.

Jaekyun Ko, Dongjin Kim, Soomin Lee + 2 more2026-03-06💻 cs

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudio demuestra que es posible predecir con un 80,4% de precisión el tipo de lanzamiento de béisbol analizando únicamente la cinemática 3D del cuerpo del lanzador, revelando que la mecánica del torso y la muñeca son los factores más determinantes y estableciendo un límite empírico para la información que puede obtenerse antes de que la pelota sea lanzada.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation

Este trabajo presenta FedMEPD, un marco de aprendizaje federado que aborda la heterogeneidad intermodal y la necesidad de personalización en la segmentación de tumores cerebrales mediante codificadores específicos por modalidad y un decodificador de fusión parcialmente personalizado que utiliza anclajes globales y atención cruzada para compensar la falta de modalidades en los clientes.

Hong Liu, Dong Wei, Qian Dai + 3 more2026-03-06💻 cs

Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object

Este trabajo propone un método de optimización de texturas adversarias para objetos 3D que, mediante renderizado diferenciable y estrategias como la expectativa sobre transformaciones y un currículo de lo grueso a lo fino, supera las limitaciones de los parches 2D al mantener su eficacia contra políticas visuomotoras bajo vistas dinámicas y distancias variables.

Chanmi Lee, Minsung Yoon, Woojae Kim + 2 more2026-03-06💻 cs

BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement

El artículo presenta BiEvLight, un marco de aprendizaje multinivel que optimiza conjuntamente la eliminación de ruido en eventos y la mejora de imágenes en condiciones de poca luz mediante un prior guiado por gradientes y una formulación de optimización jerárquica, logrando así superar a los métodos actuales en el conjunto de datos SDE.

Zishu Yao, Xiang-Xiang Su, Shengning Zhou + 3 more2026-03-06💻 cs

3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

El artículo presenta 3D-RFT, un marco pionero que aplica el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a la comprensión de escenas 3D basadas en video, optimizando directamente los modelos multimodales mediante funciones de recompensa derivadas de métricas de evaluación para lograr un rendimiento superior al estado del arte en tareas de percepción y razonamiento espacial.

Xiongkun Linghu, Jiangyong Huang, Baoxiong Jia + 1 more2026-03-06🤖 cs.AI