RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model
El artículo presenta RAG-Driver, un modelo de lenguaje grande multimodal mejorado con recuperación aumentada y aprendizaje en contexto que logra explicaciones de conducción generalizables y de vanguardia sin necesidad de reentrenamiento, abordando así los desafíos de escasez de datos y adaptación a nuevos entornos.