T2SGrid: Temporal-to-Spatial Gridification for Video Temporal Grounding
Der vorgestellte Ansatz T2SGrid verbessert die Video-Temporal-Localization, indem er zeitliche Abfolgen durch ein überlappendes Gleitfenster-Verfahren in strukturierte 2D-Gitterbilder umwandelt, um so komplexe zeitliche Dynamiken effizienter zu erfassen als herkömmliche Methoden.