CompassNav: Steering From Path Imitation To Decision Understanding In Navigation
Le papier présente CompassNav, une nouvelle approche qui remplace l'imitation de trajectoires par une compréhension des décisions via un jeu de données enrichi et une fonction de récompense hybride, permettant à un agent de 7B de surpasser les modèles propriétaires sur des benchmarks de navigation et de réussir sur un robot physique.