ExposureEngine: Oriented Logo Detection and Sponsor Visibility Analytics in Sports Broadcasts

Este artículo presenta ExposureEngine, un sistema integral que utiliza cajas delimitadoras orientadas y un agente de lenguaje natural para cuantificar con precisión la visibilidad de patrocinadores en transmisiones deportivas, superando las limitaciones de los métodos tradicionales mediante un nuevo conjunto de datos de fútbol sueco.

Mehdi Houshmand Sarkhoosh, Frøy Øye, Henrik Nestor Sørlie + 5 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Este artículo presenta XFactor, el primer modelo auto-supervisado sin geometría capaz de sintetizar nuevas vistas de forma verdaderamente transferible al desvincular la pose de la cámara del contenido de la escena mediante un esquema de aumento, demostrando que la transferibilidad es el criterio clave para validar la síntesis de nuevas vistas sin necesidad de sesgos inductivos 3D.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights

Este artículo presenta DRBD-Mamba, un modelo eficiente y robusto para la segmentación de tumores cerebrales que utiliza un mapeo de curvas de relleno de espacio y módulos de fusión para superar las limitaciones computacionales de los modelos Mamba, logrando mejoras significativas en la precisión y una eficiencia 15 veces superior en comparación con los métodos actuales.

Danish Ali, Ajmal Mian, Naveed Akhtar + 1 more2026-03-06💻 cs

FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

El artículo presenta FLoC, un marco de compresión de tokens visuales sin entrenamiento y agnóstico al modelo que utiliza la función de ubicación de instalaciones y un algoritmo greedy perezoso para seleccionar de manera eficiente un subconjunto representativo de tokens, mejorando así la comprensión de videos largos en modelos multimodales grandes.

Janghoon Cho, Jungsoo Lee, Munawar Hayat + 3 more2026-03-06💻 cs

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream es un sistema de generación de video en tiempo real que, mediante la destilación de un modelo bidireccional en un estudiante causal y el uso de atención deslizante con *attention sinks*, permite la creación de videos de duración ilimitada con control interactivo de movimiento a 29 FPS en una sola GPU, superando las limitaciones de latencia y acumulación de errores de los métodos anteriores.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

SASG-DA: Sparse-Aware Semantic-Guided Diffusion Augmentation For Myoelectric Gesture Recognition

El artículo presenta SASG-DA, un método de aumento de datos basado en difusión que utiliza representaciones semánticas y un muestreo consciente de la dispersión para generar muestras de señales electromiográficas superficiales (sEMG) fieles y diversas, mejorando así significativamente el reconocimiento de gestos y la generalización en comparación con métodos existentes.

Chen Liu, Can Han, Weishi Xu + 2 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

El artículo presenta ObAct, un marco novedoso de aprendizaje por imitación con visión activa que utiliza un sistema robótico de doble brazo con cámaras en la muñeca para construir dinámicamente una representación 3DGS, explorar virtualmente y mover el brazo observador a la posición óptima, logrando así políticas más robustas y eficaces que superan significativamente a los enfoques con cámaras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

STAvatar: Soft Binding and Temporal Density Control for Monocular 3D Head Avatars Reconstruction

STAvatar es un método de vanguardia para la reconstrucción de avatares 3D de cabeza a partir de videos monoculares que supera las limitaciones de rigidez y expresividad de los enfoques existentes mediante un marco de unión suave adaptativo a la UV y una estrategia de control de densidad temporal que optimiza la captura de detalles finos y regiones frecuentemente ocluidas.

Jiankuo Zhao, Xiangyu Zhu, Zidu Wang + 1 more2026-03-06💻 cs