Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition
이 논문은 추가적인 학습 없이 기존 확산 또는 플로우 기반 로봇 정책들의 분포 점수를 결합하여 테스트 시간에 새로운 정책을 구성하는 '일반 정책 조합 (GPC)' 방법을 제안하고, 이를 통해 개별 정책보다 우수한 성능을 달성할 수 있음을 이론적 근거와 실험을 통해 입증합니다.
Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG