UniHM: Unified Dexterous Hand Manipulation with Vision Language Model
UniHM ist ein bahnbrechendes Framework, das Vision-Language-Modelle nutzt, um dexterous Handmanipulationen durch freie Sprachbefehle zu steuern, indem es verschiedene Handmorphologien vereinheitlicht, ausschließlich auf menschlichen Interaktionsdaten trainiert wird und durch physikgesteuerte Verfeinerung realistische Bewegungsabläufe erzeugt.