Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping
本論文は、少数のデモンストレーションから視覚言語モデルのガイダンスにより意味的対応関係に基づいて軌道を歪めるオープンループ方策を設計し、これを用いて実世界で自律的に多様な機能遊びを実行することで、人間の介入を最小限に抑えながら高品質な学習データを生み出し、最終的に人間によるデモンストレーションと同等の性能を持つクローズドループ模倣方策を構築する「Tether」という手法を提案しています。