One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image

El artículo presenta One2Scene, un marco innovador que genera escenas 3D explorables y geométricamente consistentes a partir de una sola imagen mediante la descomposición del problema en la creación de vistas ancla panorámicas, la construcción de un andamio 3D explícito y la síntesis de nuevas vistas fotorealistas, superando así las limitaciones de distorsión y ruido de los métodos existentes.

Pengfei Wang, Liyi Chen, Zhiyuan Ma + 3 more2026-03-02💻 cs

From Statics to Dynamics: Physics-Aware Image Editing with Latent Transition Priors

El artículo presenta PhysicEdit, un marco de edición de imágenes impulsado por un nuevo conjunto de datos de 38K trayectorias de transición física (PhysicTran38K) y un mecanismo de razonamiento dual texto-visual, que supera a los métodos actuales al generar resultados físicamente plausibles mediante la predicción de transiciones de estado en lugar de mapeos estáticos.

Liangbing Zhao, Le Zhuo, Sayak Paul + 2 more2026-03-02💻 cs

WARM-CAT: Warm-Started Test-Time Comprehensive Knowledge Accumulation for Compositional Zero-Shot Learning

El artículo presenta WARM-CAT, un enfoque innovador para el Aprendizaje Cero-Shot Composicional que mejora el rendimiento en pruebas mediante la acumulación de conocimiento multimodal no supervisado, un mecanismo de actualización adaptativa y una cola de prioridad dinámica inicializada con datos de entrenamiento, logrando resultados de vanguardia en múltiples conjuntos de datos, incluido el nuevo C-Fashion.

Xudong Yan, Songhe Feng, Jiaxin Wang + 2 more2026-03-02💻 cs

Motion-aware Event Suppression for Event Cameras

Este trabajo presenta el primer marco de supresión de eventos consciente del movimiento, un modelo ligero que segmenta y predice el movimiento de objetos en tiempo real para filtrar eventos dinámicos, logrando un rendimiento superior en el benchmark EVIMO y mejorando significativamente aplicaciones posteriores como la inferencia de Vision Transformers y la odometría visual basada en eventos.

Roberto Pellerito, Nico Messikommer, Giovanni Cioffi + 2 more2026-03-02💻 cs

Analytical Expression for Spherically Symmetric Photoacoustic Sources: A Unified General Solution (Theoretical Analysis and Derivation)

Este artículo presenta una derivación teórica completa de una solución analítica unificada para la presión acústica generada por fuentes fotoacústicas con distribuciones de presión inicial simétricas esféricas, ofreciendo expresiones específicas para diversos perfiles de distribución y herramientas de simulación para el diseño de sistemas de imagen.

Shuang Li, Yibing Wang, Yu Zhang + 1 more2026-03-02🔬 physics.optics

Demystifying Action Space Design for Robotic Manipulation Policies

Este estudio a gran escala desmitifica el diseño del espacio de acción en políticas de manipulación robótica, demostrando mediante más de 13.000 ejecuciones reales que predecir acciones delta mejora el rendimiento y que las representaciones en espacio de tareas y espacio articular ofrecen ventajas complementarias para la generalización y la estabilidad, respectivamente.

Yuchun Feng, Jinliang Zheng, Zhihao Wang + 5 more2026-03-02💻 cs

DesignSense: A Human Preference Dataset and Reward Modeling Framework for Graphic Layout Generation

El artículo presenta DesignSense, un marco que incluye un nuevo dataset de 10.235 pares de preferencias humanas y un modelo de recompensa especializado, diseñado para superar las limitaciones de los modelos actuales y mejorar significativamente la calidad de la generación de diseños gráficos mediante la alineación con el juicio estético humano.

Varun Gopal, Rishabh Jain, Aradhya Mathur + 6 more2026-03-02🤖 cs.AI