PanoEnv: Exploring 3D Spatial Intelligence in Panoramic Environments with Reinforcement Learning
El artículo presenta PanoEnv, un nuevo benchmark de preguntas y respuestas sobre entornos panorámicos 3D y un marco de aprendizaje por refuerzo basado en GRPO con un currículo de dos etapas, que mejora significativamente la inteligencia espacial 3D de los modelos de lenguaje visuales, logrando un rendimiento superior al de modelos mucho más grandes en tareas de razonamiento espacial.