RAE-NWM: Navigation World Model in Dense Visual Representation Space
El artículo presenta RAE-NWM, un modelo de mundo para navegación que opera en un espacio de representación visual densa basado en características DINOv2 y utiliza un transformador de difusión condicional para mejorar la estabilidad estructural y la precisión de las acciones en comparación con los métodos latentes tradicionales.