SVBench: Evaluation of Video Generation Models on Social Reasoning
SVBench es el primer benchmark diseñado para evaluar la capacidad de razonamiento social de los modelos de generación de video, demostrando mediante una evaluación a gran escala que, aunque estos sistemas han mejorado en realismo visual, aún carecen de la comprensión psicológica y causal necesaria para generar comportamientos socialmente coherentes.