3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos
Il paper presenta 3PoinTr, un metodo che utilizza trasformatori per pre-addestrare politiche robotiche su video umani casuali prevedendo tracce di punti 3D come rappresentazione intermedia, consentendo un apprendimento efficiente e robusto con un numero ridotto di dimostrazioni robotiche.