Compose by Focus: Scene Graph-based Atomic Skills
Dit artikel introduceert een robuust raamwerk voor compositional generalisatie in algemene robots dat scene graphs combineert met diffusie-imitatieleren en een vision-language model om complexe, langdurige taken succesvoller uit te voeren dan bestaande methoden.