Keeping the Evidence Chain: Semantic Evidence Allocation for Training-Free Token Pruning in Video Temporal Grounding
Die Arbeit stellt SemVID vor, ein trainingsfreies Framework zur semantischen Token-Zuteilung, das durch die Prinzipien der Beweisretention und Verbindungsstärke die Effizienz bei der Video-Temporal-Grounding signifikant steigert, ohne die Genauigkeit zu beeinträchtigen.