Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views
Dit paper introduceert 3DThinker, een innovatief raamwerk dat het ruimtelijk redeneren van vision-language modellen verbetert door tijdens het redeneren 3D-mentale beelden te genereren zonder voorafgaande 3D-invoer of gelabelde 3D-data.