TTOM: Test-Time Optimization and Memorization for Compositional Video Generation
Das Paper stellt TTOM vor, ein training-freies Framework, das durch Test-Time-Optimierung und einen parametrischen Speichermechanismus die Fähigkeit von Video-Foundation-Modellen zur kompositorischen Generierung verbessert, indem es die Ausgabe während der Inferenz an räumlich-zeitliche Layouts anpasst.