Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Aurora ist ein multimodales Zeitreihen-Grundmodell, das durch die adaptive Nutzung von Text- und Bilddaten sowie eine prototypenbasierte Flow-Matching-Decodierung überlegene Zero-Shot-Generalisierung und probabilistische Vorhersagen über verschiedene Domänen hinweg ermöglicht.

Xingjian Wu, Jianxin Jin, Wanghui Qiu, Peng Chen, Yang Shu, Bin Yang, Chenjuan Guo

Veröffentlicht 2026-03-10
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du möchtest das Wetter für die nächste Woche vorhersagen. Ein normaler Computer würde einfach nur auf die Temperaturkurve der letzten Tage schauen und sagen: „Es sieht nach Regen aus, also wird es morgen wahrscheinlich auch regnen." Das funktioniert gut, solange sich nichts Grundlegendes ändert.

Aber was passiert, wenn plötzlich ein riesiger Sturm aus dem Norden kommt? Oder wenn eine neue Nachricht in den Nachrichten sagt, dass ein Vulkan ausgebrochen ist? Ein reiner Zahlen-Komputer würde diese wichtigen Informationen übersehen, weil er nur auf die Kurve schaut. Er weiß nicht, dass „Sturm" oder „Vulkan" bedeuten, dass die Vorhersage komplett anders aussehen muss.

Genau hier kommt Aurora ins Spiel. Aurora ist wie ein allwissender Wetterprofi, der nicht nur auf die Zahlen schaut, sondern auch die Nachrichtenartikel und Fotos dazu liest.

Hier ist die Erklärung, wie Aurora funktioniert, ganz einfach und mit ein paar kreativen Vergleichen:

1. Das Problem: Der „Blinde" Prognostiker

Frühere Modelle waren wie ein blinder Koch, der nur schmecken kann, aber nicht sieht oder riecht. Wenn er eine Suppe kocht (eine Vorhersage macht), weiß er nur, wie die Suppe in der letzten Stunde schmeckte. Wenn plötzlich jemand eine neue Zutat (z. B. eine plötzliche Kältewelle oder eine Wirtschaftskrise) hinzufügt, die in den Nachrichten steht, bleibt der Koch verwirrt. Er kann nicht verstehen, warum sich der Geschmack plötzlich ändert, weil er die „Zutatenliste" (Text) und das „Foto der Zutaten" (Bild) ignoriert.

2. Die Lösung: Aurora – Der „Multitalent-Koch"

Aurora ist ein neues Modell, das alles gleichzeitig versteht:

  • Die Zahlen (die Zeitreihe selbst).
  • Den Text (z. B. „Heute gab es eine Warnung vor einem Hurrikan").
  • Die Bilder (z. B. ein Foto von dunklen Wolken oder einem Diagramm, das eine bestimmte Form hat).

Stell dir Aurora wie einen Detektiv vor, der bei einem Fall alle Beweise sammelt: nicht nur die Fingerabdrücke (Zahlen), sondern auch die Aussagen der Zeugen (Text) und die Fotos vom Tatort (Bilder). Nur wenn er alle diese Informationen kombiniert, kann er die Zukunft wirklich genau vorhersagen.

3. Wie lernt Aurora? (Der „Universitäts-Abschluss")

Bevor Aurora auf den Markt kommt, hat es eine riesige Schule besucht. Diese Schule nannte sich „Cross-Domain Multimodal Time Series Corpus".

  • Was lernte es? Es hat Millionen von Beispielen gesehen: Verkehrsdaten mit Nachrichten über Staus, Aktienkurse mit Wirtschaftsberichten, Temperaturdaten mit Wettervorhersagen.
  • Der Clou: Es hat gelernt, dass ähnliche Zahlenverläufe in verschiedenen Welten (z. B. Verkehr in Los Angeles vs. Temperatur in Chicago) völlig unterschiedliche Zukünfte haben können, je nachdem, was im Text dazu steht.

Dank dieses Trainings kann Aurora Zero-Shot lernen. Das bedeutet: Wenn es auf eine völlig neue Aufgabe trifft, für die es nie speziell trainiert wurde (z. B. eine neue Art von Energieverbrauch), kann es trotzdem eine gute Vorhersage machen, weil es die Prinzipien verstanden hat, nicht nur die Zahlen auswendig gelernt hat.

4. Die zwei genialen Tricks von Aurora

Aurora nutzt zwei spezielle Werkzeuge, um seine Vorhersagen zu verbessern:

A. Der „Kompass" (Modality-Guided Attention)

Stell dir vor, Aurora schaut auf eine lange Liste von Zahlen. Normalerweise würde es jede Zahl gleich wichtig nehmen. Aber Aurora hat einen Kompass, der ihm sagt: „Hey, schau mal hier! Dieser Text hier sagt, dass morgen ein Feiertag ist. Also ist diese Zahl hier (der Verkehr heute Abend) viel wichtiger als die anderen."
Der Kompass lenkt die Aufmerksamkeit des Modells genau dorthin, wo die wichtigen Informationen aus Text oder Bild versteckt sind. Es filtert den Lärm heraus und konzentriert sich auf das Wesentliche.

B. Der „Skizzenblock" (Prototype-Guided Flow Matching)

Wenn man eine Vorhersage macht, ist es schwer, von Null auf 100 zu kommen. Aurora macht es anders.

  • Andere Modelle starten oft mit einem zufälligen Rauschen (wie ein Künstler, der auf eine leere Leinwand spritzt und hofft, dass ein Bild entsteht).
  • Aurora hat einen Skizzenblock (eine Bibliothek von Mustern). Bevor es die Vorhersage schreibt, sucht es in diesem Block nach einem Muster, das passt (z. B. ein typischer „Winter-Trend" oder ein „Feiertags-Trend").
  • Es nimmt diese Skizze als Startpunkt und malt dann die Details darauf. Das macht die Vorhersage viel stabiler und genauer, weil sie auf echten Mustern basiert und nicht auf Zufall.

5. Das Ergebnis: Der „Schweizer Taschenmesser" der Vorhersagen

In Tests hat Aurora gezeigt, dass es besser ist als alle bisherigen Modelle – egal ob es nur um Zahlen geht oder ob Text und Bilder dabei sind.

  • Es ist wie ein Schweizer Taschenmesser: Es kann alles. Es kann deterministisch vorhersagen (eine feste Zahl nennen) und probabilistisch (eine Bandbreite von Möglichkeiten nennen, z. B. „Es wird wahrscheinlich zwischen 10 und 15 Grad sein").
  • Es funktioniert in der Wirtschaft, im Verkehr, bei Wetterdaten und im Gesundheitswesen.

Zusammenfassung

Aurora ist der erste große Durchbruch, der Zeitreihen-Vorhersagen so macht, wie ein Mensch es tun würde: Es schaut nicht nur auf die Zahlen, sondern liest die Zeitung und betrachtet die Bilder dazu. Durch dieses ganzheitliche Verständnis kann es auch in unbekannten Situationen (Zero-Shot) brillante Vorhersagen treffen, die andere Modelle verpassen würden.

Es ist nicht nur ein Rechner; es ist ein intelligenter Assistent, der den Kontext versteht, bevor er die Zukunft vorhersagt.