TimeProVe: Propose, then Verify for Efficient Long Video Temporal Reasoning in Activities of Daily Living
O artigo apresenta o TimeProVe, um framework híbrido de baixo custo que combina a geração de hipóteses leves baseadas em ações com a verificação direcionada por VLM para alcançar o estado da arte em raciocínio temporal em vídeos longos, reduzindo significativamente os custos computacionais, juntamente com a proposta do benchmark OpenTSUBench para avaliar cenários de Atividades da Vida Diária.