CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload

Das Paper stellt CloudFormer vor, ein auf Transformer-Architekturen basierendes Modell, das mithilfe von 206 Systemmetriken die Leistungsverschlechterung von virtuellen Maschinen in öffentlichen Cloud-Umgebungen mit unbekannter Arbeitslast präzise vorhersagt und dabei den aktuellen Stand der Technik deutlich übertrifft.

Amirhossein Shahbazinia, Darong Huang, Luis Costero, David Atienza

Veröffentlicht 2026-03-26
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich einen riesigen, modernen Wolkenkratzer vor, der als öffentliche Cloud dient. In diesem Gebäude wohnen viele verschiedene Mieter (die sogenannten Virtual Machines oder VMs). Jeder Mieter hat seine eigene Wohnung mit fest zugewiesenen Möbeln (CPU-Kerne, Arbeitsspeicher). Das klingt sicher, oder?

Aber hier liegt das Problem: Alle Mieter teilen sich die Gemeinschaftsbereiche – den Aufzug, die Wasserrohre im Keller und den WLAN-Router auf dem Dach.

Wenn ein Mieter gerade eine riesige Party gibt (eine rechenintensive Aufgabe), kann es passieren, dass der Aufzug für alle anderen blockiert ist oder das WLAN so langsam wird, dass die anderen Mieter nicht mehr surfen können. Das nennt man Leistungseinbußen durch Konkurrenz. In der IT-Sprache ist das "Ressourcen-Interferenz".

Das Schwierige an dieser Cloud-Wohnanlage ist, dass der Vermieter (der Cloud-Anbieter) nicht in die Wohnungen schauen darf. Aus Datenschutzgründen ist jede Wohnung eine "Blackbox". Der Vermieter sieht nur, wie laut es im Flur ist oder wie viel Strom der ganze Stockwerk verbraucht, aber nicht, was genau die Mieter tun.

Das Problem: Die Glaskugel fehlt

Bisher mussten die Vermieter raten, wann es laut wird. Wenn ein Mieter klagte, dass es langsam ist, war es oft schon zu spät. Die alten Methoden waren wie ein Wetterbericht, der nur für einen bestimmten Tag und eine bestimmte Stadt galt. Wenn sich das Wetter plötzlich änderte (neue Arbeitslasten), versagten die Vorhersagen.

Die Lösung: CloudFormer – Der super-detective

Die Autoren dieses Papers haben eine neue KI entwickelt, die sie CloudFormer nennen. Man kann sich CloudFormer wie einen genialen Detektiv vorstellen, der zwei verschiedene Brillen trägt, um das Chaos im Wolkenkratzer zu verstehen:

  1. Die Zeit-Brille (Temporal Branch):
    Diese Brille schaut sich an, wie sich die Geräusche im Laufe der Zeit verändern.

    • Analogie: Der Detektiv merkt: "Aha, jeden Dienstag um 10 Uhr wird es im Flur lauter, weil die Postboten kommen." Oder: "Plötzlich gibt es einen kurzen, lauten Schrei (ein CPU-Burst), der nur eine Sekunde dauert."
    • Diese Brille erfasst die Dynamik: Was passiert gerade? Wie schnell ändert sich die Situation?
  2. Die System-Brille (System Branch):
    Diese Brille schaut sich die Zusammenhänge zwischen den verschiedenen Messwerten an, ohne auf die Zeit zu achten.

    • Analogie: Der Detektiv merkt: "Wenn der Stromverbrauch im Keller hoch ist, ist fast immer auch die Temperatur im Dachgeschoss hoch." Oder: "Wenn der Aufzug voll ist, ist auch die WLAN-Geschwindigkeit schlecht."
    • Diese Brille erfasst die Struktur: Welche Ressourcen beeinflussen sich gegenseitig?

Der Trick: CloudFormer kombiniert beide Brillen. Er weiß also nicht nur, dass es laut ist, sondern auch warum (weil der Aufzug voll ist) und wann es wieder leiser wird.

Der Datenschatz: CloudPerfTrace

Um diesen Detektiv zu trainieren, brauchten die Forscher eine riesige Menge an Beweismaterial. Bisherige Daten waren wie alte, unscharfe Fotos (nur alle 5 Minuten ein Bild).
CloudFormer bekam jedoch 206 verschiedene Messwerte pro Sekunde über einen Zeitraum von Monaten.

  • Vergleich: Stellen Sie sich vor, Sie filmen das Gebäude nicht mit einer alten Kamera, die alle 5 Minuten ein Bild macht, sondern mit einem 4K-Video, das 206 verschiedene Aspekte (Licht, Lärm, Temperatur, Strom) gleichzeitig in extrem hoher Qualität aufzeichnet. Das erlaubt dem Detektiv, auch winzige, kurzfristige Störungen zu erkennen, die andere übersehen würden.

Das Ergebnis: Warum ist das so toll?

Die Forscher haben CloudFormer gegen die besten alten Methoden getestet.

  • Die alten Methoden lagen oft um 10–15 % daneben (das ist wie wenn der Detektiv sagt: "Es wird heute regnen", aber es schüttet wie aus Kübeln).
  • CloudFormer lag nur bei 7,8 % Fehler. Das ist eine enorme Verbesserung.

Die einfache Botschaft:
CloudFormer ist wie ein super-kluger Hausmeister, der durch die Kombination von "Zeit-Mustern" und "Zusammenhangs-Mustern" vorhersagen kann, wann es in der Cloud langsam wird, bevor es passiert. Er funktioniert auch dann, wenn er noch nie diesen speziellen Mieter gesehen hat (neue Arbeitslasten), und braucht dafür keine Geheimnisse aus den Wohnungen zu kennen.

Das bedeutet für die Zukunft: Cloud-Dienste werden stabiler, schneller und effizienter, weil der Vermieter proaktiv eingreifen kann, bevor die Mieter überhaupt merken, dass etwas nicht stimmt.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →