SceneCOT: Eliciting Grounded Chain-of-Thought Reasoning in 3D Scenes
O artigo apresenta o framework SceneCOT, que introduz um método de raciocínio em cadeia de pensamento fundamentado em cenas 3D e o dataset SCENECOT-185K para superar as limitações atuais na resposta fundamentada de modelos de linguagem grandes em ambientes tridimensionais.