SceneCOT: Eliciting Grounded Chain-of-Thought Reasoning in 3D Scenes
Dit paper introduceert SceneCOT, een nieuw raamwerk met een op de 3D-scène gebaseerde Chain-of-Thought-redeneermethode en het bijbehorende SCENECOT-185K-dataset, dat voor het eerst menselijke stap-voor-stap redenering mogelijk maakt voor grondige vraag-antwoordtaken in 3D-scènes.