Learning to Drive is a Free Gift: Large-Scale Label-Free Autonomy Pretraining from Unposed In-The-Wild Videos
O artigo apresenta o LFG, um modelo de pré-treinamento autônomo sem rótulos que utiliza vídeos de direção não estruturados da internet e um mecanismo de ensino multi-modal para aprender representações unificadas de geometria e movimento, superando métodos existentes em tarefas de planejamento e previsão sem a necessidade de dados anotados ou LiDAR.