Proact-VL: A Proactive VideoLLM for Real-Time AI Companions
Ce papier présente Proact-VL, un cadre général pour des agents interactifs en temps réel capables de perception proactive, évalué via le Live Gaming Benchmark qui démontre des performances supérieures en latence et en qualité pour des applications d'accompagnement humain.