TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation
Le papier présente TiPToP, un système de planification modulaire et open-vocabulary qui combine des modèles de vision préentraînés avec un planificateur TAMP pour exécuter des tâches de manipulation robotique complexes à partir d'images et d'instructions naturelles, surpassant ou égalant les performances d'un modèle VLA entraîné sur des données spécifiques sans nécessiter aucune donnée robotique.