EVA: Efficient Reinforcement Learning for End-to-End Video Agent
Le papier présente EVA, un cadre d'apprentissage par renforcement efficace qui permet à un agent vidéo de planifier avant de percevoir grâce à un raisonnement itératif et à un pipeline d'entraînement en trois étapes, surpassant ainsi les méthodes existantes sur plusieurs benchmarks de compréhension vidéo.