DexHiL: A Human-in-the-Loop Framework for Vision-Language-Action Model Post-Training in Dexterous Manipulation
이 논문은 다관절 손의 복잡한 제어를 위한 비전 - 언어 - 행동 (VLA) 모델의 사후 훈련을 위해 인간 개입을 통합한 최초의 프레임워크인 'DexHiL'을 제안하며, 실시간 교정 및 데이터 샘플링 전략을 통해 기존 오프라인 미세 조정 대비 평균 25% 높은 성공률을 달성함을 보여줍니다.