SceneAssistant: A Visual Feedback Agent for Open-Vocabulary 3D Scene Generation
Le papier présente SceneAssistant, un agent piloté par un retour visuel qui combine des modèles de génération d'objets 3D et des modèles vision-langage pour créer et modifier des scènes 3D ouvertes et de haute qualité à partir de descriptions textuelles naturelles.