UETrack: A Unified and Efficient Framework for Single Object Tracking

UETrack es un marco unificado y eficiente para el seguimiento de objetos individuales que supera las limitaciones de los métodos existentes al manejar múltiples modalidades (como RGB, profundidad, térmica, eventos y lenguaje) mediante un mecanismo de mezcla de expertos y una estrategia de destilación adaptativa, logrando un equilibrio superior entre velocidad y precisión en diversos benchmarks y plataformas de hardware.

Ben Kang, Jie Zhao, Xin Chen + 5 more2026-03-04💻 cs

InterCoG: Towards Spatially Precise Image Editing with Interleaved Chain-of-Grounding Reasoning

El artículo presenta InterCoG, un marco de razonamiento de cadena de anclaje intercalado que mejora la edición de imágenes de alta precisión en escenas complejas mediante un proceso de razonamiento espacial textual seguido de anclaje visual y reescritura de instrucciones, respaldado por el nuevo conjunto de datos GroundEdit-45K y una arquitectura de entrenamiento especializada.

Yecong Wan, Fan Li, Chunwei Wang + 3 more2026-03-04💻 cs

PromptStereo: Zero-Shot Stereo Matching via Structure and Motion Prompts

El artículo presenta PromptStereo, un método de correspondencia estéreo de cero disparos que utiliza una Unidad Recurrente de Prompts (PRU) para integrar señales de estructura monoculares y movimiento estéreo en la fase de refinamiento iterativo, logrando un rendimiento superior y una inferencia rápida al aprovechar modelos de profundidad monoculares fundacionales.

Xianqi Wang, Hao Yang, Hangtian Wang + 4 more2026-03-04💻 cs

OnlineX: Unified Online 3D Reconstruction and Understanding with Active-to-Stable State Evolution

El artículo presenta OnlineX, un marco de trabajo unificado que supera las limitaciones de los métodos de reconstrucción 3D actuales mediante una evolución de estado de "activo a estable" que permite la reconstrucción continua y en tiempo real de la apariencia visual y campos lingüísticos a partir de imágenes en flujo, resolviendo eficazmente el problema de la deriva acumulativa.

Chong Xia, Fangfu Liu, Yule Wang + 2 more2026-03-04💻 cs

Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting

El artículo presenta TimeGS, un marco innovador que reformula el pronóstico de series temporales como un proceso de renderizado 2D mediante la proyección de secuencias futuras en una superficie latente continua utilizando kernels gaussianos anisotrópicos y mecanismos de continuidad cronológica para superar las limitaciones topológicas y de resolución de los métodos existentes.

Yixin Wang, Yifan Hu, Peiyuan Liu + 3 more2026-03-04🤖 cs.AI

CamDirector: Towards Long-Term Coherent Video Trajectory Editing

El artículo presenta CamDirector, un nuevo marco para la edición de trayectorias de video que logra una coherencia temporal a largo plazo mediante un esquema de deformación híbrido y un modelo de difusión autoregresivo guiado por el historial, superando las limitaciones de los métodos existentes y estableciendo un nuevo estándar de rendimiento en el nuevo benchmark iPhone-PTZ.

Zhihao Shi, Kejia Yin, Weilin Wan + 5 more2026-03-04💻 cs

Beyond Prompt Degradation: Prototype-guided Dual-pool Prompting for Incremental Object Detection

El artículo presenta PDP, un marco novedoso para la detección incremental de objetos que utiliza un paradigma de desacoplamiento de prompts de doble piscina y un módulo de generación de pseudoetiquetas prototípicas para mitigar la degradación y deriva de los prompts, logrando así un rendimiento superior en los conjuntos de datos MS-COCO y PASCAL VOC.

Yaoteng Zhang, Zhou Qing, Junyu Gao + 1 more2026-03-04🤖 cs.AI

HAMMER: Harnessing MLLM via Cross-Modal Integration for Intention-Driven 3D Affordance Grounding

El artículo presenta HAMMER, un marco innovador que aprovecha los modelos de lenguaje grandes multimodales (MLLM) mediante una integración cruzada jerárquica y un módulo de elevación geométrica para lograr una localización precisa de la afección 3D basada en la intención de interacción, superando a los métodos existentes en precisión y robustez.

Lei Yao, Yong Chen, Yuejiao Su + 3 more2026-03-04💻 cs