TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation
Das Paper stellt TiPToP vor, ein modulares Open-Vocabulary-Planungssystem für Roboter, das vortrainierte Vision-Modelle mit einem Task-and-Motion-Planer kombiniert, um komplexe Manipulationsaufgaben allein aus RGB-Bildern und Sprachbefehlen zu lösen, ohne dass roboterspezifische Trainingsdaten erforderlich sind.