Learning to Drive is a Free Gift: Large-Scale Label-Free Autonomy Pretraining from Unposed In-The-Wild Videos
El artículo presenta LFG, un marco de preentrenamiento sin etiquetas que utiliza videos de conducción en internet sin poses ni anotaciones para aprender representaciones unificadas de percepción autónoma mediante modelos maestros multimodales, logrando un rendimiento superior en tareas de planificación y predicción de movimiento.