MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

Das Paper stellt MeanCache vor, ein training-freies Caching-Framework für Flow Matching, das durch die Nutzung von durchschnittlichen Geschwindigkeiten anstelle von momentanen Geschwindigkeiten sowie einer Trajektorien-Stabilitäts-Strategie die Inferenzgeschwindigkeit bei gleichzeitiger Aufrechterhaltung der Generierungsqualität signifikant steigert.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian

Veröffentlicht 2026-03-10
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

MeanCache: Der „Durchschnitts-Geschwindigkeits"-Trick für schnellere KI-Kunst

Stellen Sie sich vor, eine KI (wie FLUX oder HunyuanVideo) malt ein Bild oder erstellt ein Video. Um von einem statischen Rauschen zu einem klaren Bild zu kommen, muss sie viele kleine Schritte machen – wie ein Wanderer, der einen steilen Berg hinabsteigt. Jeder Schritt erfordert eine Berechnung, was sehr lange dauert und viel Rechenleistung kostet.

Bisherige Methoden, um diesen Prozess zu beschleunigen, waren wie ein Stolpern im Dunkeln: Sie versuchten, Schritte zu überspringen, indem sie die momentane Geschwindigkeit des Wanderers nahmen. Das Problem: Wenn man nur auf den aktuellen, winzigen Moment schaut, ist die Richtung oft unruhig und schwankt stark. Wenn man versucht, mehrere Schritte auf einmal zu springen, basierend auf diesem unruhigen Moment, landet man schnell weit weg vom richtigen Pfad. Das Bild wird dann unscharf oder verzerrt.

MeanCache ist wie ein neuer, kluger Navigator, der das Problem auf eine völlig andere Art löst. Hier ist die Erklärung mit einfachen Analogien:

1. Der Unterschied zwischen „Momentaufnahme" und „Durchschnitt"

Stellen Sie sich vor, Sie fahren mit dem Auto eine kurvenreiche Straße hinunter.

  • Die alte Methode (Momentgeschwindigkeit): Sie schauen nur auf den Tacho genau in diesem Sekundenbruchteil. Wenn Sie gerade eine Kurve nehmen, zeigt der Tacho vielleicht 80 km/h, aber die Richtung ändert sich sofort. Wenn Sie jetzt versuchen, 10 Sekunden lang geradeaus zu fahren, basierend auf dieser einen Zahl, landen Sie im Feld.
  • Die neue Methode (MeanCache - Durchschnittsgeschwindigkeit): MeanCache schaut nicht auf den Tacho in diesem einen Moment, sondern berechnet die durchschnittliche Geschwindigkeit über einen ganzen Abschnitt der Straße. „Ich bin in den letzten 100 Metern im Durchschnitt mit 60 km/h gefahren und habe mich leicht nach links geneigt." Diese Durchschnittsbewegung ist viel glatter und stabiler.

Die Idee: Anstatt zu versuchen, die instabile, zitternde Bewegung des KI-Modells zu kopieren, berechnet MeanCache den „glatten Durchschnitt" über einen Zeitraum. Das ist viel sicherer, um große Sprünge zu machen, ohne vom Weg abzukommen.

2. Der „Geister-Trick" (JVP-Caching)

Wie kann die KI den Durchschnitt berechnen, ohne den ganzen Weg neu zu laufen?
Stellen Sie sich vor, Sie haben einen Wegweiser, der Ihnen sagt: „Wenn du hier warst und dort warst, war die Richtung dazwischen so."
MeanCache nutzt einen mathematischen Trick (genannt JVP), um diese „Durchschnittsrichtung" aus alten, bereits berechneten Daten zu schätzen, ohne die schwere Arbeit erneut zu verrichten. Es ist, als würde ein erfahrener Wanderer sagen: „Ich weiß, wie die Kurve zwischen Punkt A und B war, also muss ich sie nicht neu vermessen, um zu wissen, wohin wir in Punkt C gehen."

3. Der intelligente Zeitplan (Trajectory-Stability Scheduling)

Man kann nicht überall einfach so springen. Manchmal muss man genau hinschauen, manchmal darf man schnell rennen.
MeanCache nutzt eine Art Karten-Algorithmus, der wie ein Schachspieler denkt:

  • Er zeichnet eine Karte aller möglichen Schritte.
  • Er sucht den Weg, der die wenigsten Fehler macht (den „kürzesten Weg" mit den geringsten Risiken).
  • Er verhindert, dass sich viele kleine Fehler an einer Stelle häufen (wie ein Stau), und verteilt die Sprünge intelligent.

Das Ergebnis ist ein Fahrplan, der genau sagt: „Hier machen wir einen kleinen Schritt, hier können wir einen großen Sprung wagen, und hier müssen wir vorsichtig sein."

Das Ergebnis: Schnell, aber ohne Qualitätsverlust

In Tests mit großen Modellen wie FLUX.1 (für Bilder) und HunyuanVideo (für Videos) hat MeanCache gezeigt, dass es:

  • 4-mal schneller ist als bisherige Methoden.
  • Die Bilder und Videos schärfer und genauer hält als die Konkurrenz.
  • Keine neue Trainingszeit benötigt (es ist ein „Plug-and-Play"-Upgrade).

Zusammenfassend:
Bisherige Methoden versuchten, die KI zu zwingen, schneller zu rennen, indem sie ihre Schritte verkürzten – dabei stolperten sie oft. MeanCache sagt: „Lass uns nicht rennen, sondern gleiten." Indem es die glatte Durchschnittsbewegung nutzt und intelligent plant, wann es welche Schritte macht, erreicht es Geschwindigkeiten, die früher unmöglich schienen, ohne dass das Kunstwerk dabei leidet. Es ist der Unterschied zwischen einem ungestümen Sprinter, der stolpert, und einem eleganten Eisläufer, der die Kurven perfekt nutzt.