TopoBench: Benchmarking LLMs on Hard Topological Reasoning
Dit paper introduceert TopoBench, een benchmark voor het evalueren van de vermogens van grote taalmodellen bij het oplossen van complexe topologische raadsels, en onthult dat de voornaamste beperking ligt in het extraheren van ruimtelijke constraints uit representaties in plaats van in het redeneren daarover.