WalkGPT: Grounded Vision-Language Conversation with Depth-Aware Segmentation for Pedestrian Navigation
WalkGPT is een pixel-gebaseerd vision-language model dat met behulp van dieptebewuste segmentatie en een nieuw benchmark (PAVE) betrouwbare, toegankelijke navigatiegidsen voor voetgangers genereert door semantische en ruimtelijke aspecten van stedelijke omgevingen te combineren.