EgoTraj-Bench: Towards Robust Trajectory Prediction Under Ego-view Noisy Observations

Este trabajo presenta EgoTraj-Bench, el primer benchmark del mundo real para la predicción de trayectorias en visión ego-centrica bajo observaciones ruidosas, junto con BiFlow, un modelo de flujo de doble corriente que logra un rendimiento superior al estado del arte al denoizar observaciones históricas y predecir movimientos futuros mediante un mecanismo de anclaje ego.

Jiayi Liu, Jiaming Zhou, Ke Ye + 3 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

El artículo presenta VidGuard-R1, el primer detector de videos generado por IA que utiliza optimización de políticas relativas grupales (GRPO) y modelos de lenguaje multimodal de razonamiento para superar las limitaciones de los métodos supervisados tradicionales, ofreciendo un rendimiento superior en cero disparos y explicaciones forenses basadas en la física.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

ExposureEngine: Oriented Logo Detection and Sponsor Visibility Analytics in Sports Broadcasts

Este artículo presenta ExposureEngine, un sistema integral que utiliza cajas delimitadoras orientadas y un agente de lenguaje natural para cuantificar con precisión la visibilidad de patrocinadores en transmisiones deportivas, superando las limitaciones de los métodos tradicionales mediante un nuevo conjunto de datos de fútbol sueco.

Mehdi Houshmand Sarkhoosh, Frøy Øye, Henrik Nestor Sørlie + 5 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Este artículo presenta XFactor, el primer modelo auto-supervisado sin geometría capaz de sintetizar nuevas vistas de forma verdaderamente transferible al desvincular la pose de la cámara del contenido de la escena mediante un esquema de aumento, demostrando que la transferibilidad es el criterio clave para validar la síntesis de nuevas vistas sin necesidad de sesgos inductivos 3D.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights

Este artículo presenta DRBD-Mamba, un modelo eficiente y robusto para la segmentación de tumores cerebrales que utiliza un mapeo de curvas de relleno de espacio y módulos de fusión para superar las limitaciones computacionales de los modelos Mamba, logrando mejoras significativas en la precisión y una eficiencia 15 veces superior en comparación con los métodos actuales.

Danish Ali, Ajmal Mian, Naveed Akhtar + 1 more2026-03-06💻 cs

FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

El artículo presenta FLoC, un marco de compresión de tokens visuales sin entrenamiento y agnóstico al modelo que utiliza la función de ubicación de instalaciones y un algoritmo greedy perezoso para seleccionar de manera eficiente un subconjunto representativo de tokens, mejorando así la comprensión de videos largos en modelos multimodales grandes.

Janghoon Cho, Jungsoo Lee, Munawar Hayat + 3 more2026-03-06💻 cs

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream es un sistema de generación de video en tiempo real que, mediante la destilación de un modelo bidireccional en un estudiante causal y el uso de atención deslizante con *attention sinks*, permite la creación de videos de duración ilimitada con control interactivo de movimiento a 29 FPS en una sola GPU, superando las limitaciones de latencia y acumulación de errores de los métodos anteriores.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

SASG-DA: Sparse-Aware Semantic-Guided Diffusion Augmentation For Myoelectric Gesture Recognition

El artículo presenta SASG-DA, un método de aumento de datos basado en difusión que utiliza representaciones semánticas y un muestreo consciente de la dispersión para generar muestras de señales electromiográficas superficiales (sEMG) fieles y diversas, mejorando así significativamente el reconocimiento de gestos y la generalización en comparación con métodos existentes.

Chen Liu, Can Han, Weishi Xu + 2 more2026-03-06💻 cs