Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence
O artigo apresenta o Holi-Spatial, o primeiro conjunto de dados multimodal espacialmente consciente em grande escala, construído totalmente de forma automatizada a partir de vídeos brutos sem intervenção humana, que oferece anotações semânticas e geométricas de alta qualidade para superar as limitações de escalabilidade e viés de domínio dos métodos existentes e aprimorar significativamente o raciocínio espacial de modelos de visão e linguagem.
Yuanyuan Gao, Hao Li, Yifei Liu, Xinhao Ji, Yuning Gong, Yuanjun Liao, Fangfu Liu, Manyuan Zhang, Yuchen Yang, Dan Xu, Xue Yang, Huaxi Huang, Hongjie Zhang, Ziwei Liu, Xiao Sun, Dingwen Zhang, Zhihang Zhong2026-03-10💻 cs