T2SGrid: Temporal-to-Spatial Gridification for Video Temporal Grounding
O artigo apresenta o T2SGrid, um novo framework para Grounding Temporal em Vídeo que transforma sequências temporais em layouts espaciais bidimensionais organizados em grade, superando as limitações das abordagens existentes ao melhorar a compreensão das dinâmicas temporais e a atenção visual.