Keep it SymPL: Symbolic Projective Layout for Allocentric Spatial Reasoning in Vision-Language Models
Il paper introduce SymPL, un framework che trasforma il ragionamento spaziale allocentrico in rappresentazioni simboliche strutturate, migliorando significativamente le prestazioni dei modelli visione-linguaggio in compiti complessi di percezione spaziale da diverse prospettive.