Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark
Il paper presenta Spatial4D-Bench, un benchmark su larga scala composto da circa 40.000 coppie domanda-risposta e 18 task organizzati in sei categorie cognitive, progettato per valutare in modo completo le capacità di ragionamento spaziale 4D dei modelli linguistici multimodali e rivelare le loro attuali limitazioni rispetto all'intelligenza umana.
Pan Wang, Yang Liu, Guile Wu, Eduardo R. Corral-Soto, Chengjie Huang, Binbin Xu, Dongfeng Bai, Xu Yan, Yuan Ren, Xingxin Chen, Yizhe Wu, Tao Huang, Wenjun Wan, Xin Wu, Pei Zhou, Xuyang Dai, Kangbo Lv, Hongbo Zhang, Yosef Fried, Aixue Ye, Bailan Feng, Zhenyu Chen, Zhen Li, Yingcong Chen, Yiyi Liao, Bingbing Liu2026-03-09💻 cs