WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching
Die Arbeit stellt WorldCache vor, ein Caching-Framework für Diffusions-basierte Weltmodelle, das durch kurvengeleitete, heterogene Token-Vorhersage und chaotisch priorisiertes adaptives Überspringen die Inferenzgeschwindigkeit um das 3,7-fache steigert, ohne dabei die Rollout-Qualität zu beeinträchtigen.