A Very Big Video Reasoning Suite
Questo lavoro introduce VBVR, un dataset su larga scala e un framework di valutazione per colmare il divario nella ricerca sul ragionamento video, consentendo studi di scalabilità che mostrano i primi segni di generalizzazione emergente verso compiti non visti.