TimeProVe: Propose, then Verify for Efficient Long Video Temporal Reasoning in Activities of Daily Living
Het artikel introduceert TimeProVe, een kostenefficiënt hybride framework dat lichtgewicht actie-gegronde hypothesegeneratie combineert met gerichte VLM-verificatie om state-of-the-art temporele redenering in lange video's te bereiken terwijl de computationele kosten aanzienlijk worden verminderd, samen met de voorstel van de OpenTSUBench benchmark voor het evalueren van Activities of Daily Living scenario's.