MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts

Die Arbeit stellt MoHETS vor, einen Encoder-only-Transformer mit Mixture-of-Heterogeneous-Experts, der durch die Kombination von tiefenkonvolutionellen und Fourier-basierten Experten sowie die Integration exogener Variablen das State-of-the-Art bei der langfristigen multivariaten Zeitreihenvorhersage verbessert.

Evandro S. Ortigossa, Guy Lutsker, Eran Segal

Veröffentlicht 2026-03-16
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie versuchen, das Wetter für die nächsten drei Monate vorherzusagen. Das ist eine schwierige Aufgabe, weil das Wetter viele verschiedene Muster hat: Es gibt langfristige Trends (der Winter wird kälter), regelmäßige Zyklen (jeden Tag ist es morgens kühler als abends) und plötzliche, chaotische Störungen (ein plötzlicher Gewittersturm).

Frühere KI-Modelle waren wie ein Einzelkünstler, der versucht, all diese verschiedenen Aufgaben mit nur einem einzigen Werkzeug zu erledigen. Wenn er versucht, den langfristigen Trend zu verstehen, vergisst er die täglichen Schwankungen. Wenn er sich auf die täglichen Schwankungen konzentriert, verpasst er den großen Überblick. Das Ergebnis war oft ungenau.

Die Forscher in diesem Papier haben eine neue Lösung namens MoHETS entwickelt. Hier ist eine einfache Erklärung, wie sie funktioniert, mit ein paar kreativen Vergleichen:

1. Das Team aus Spezialisten (MoHE)

Stellen Sie sich MoHETS nicht als einen einzelnen Mitarbeiter vor, sondern als ein hochspezialisiertes Team, das in einem Büro sitzt.

  • Das alte Problem: Früher hatte jedes Teammitglied das gleiche Werkzeug (einen einfachen Rechner) und musste alles selbst machen. Das war ineffizient.
  • Die MoHETS-Lösung: Das Team besteht aus verschiedenen Experten mit unterschiedlichen Werkzeugen:
    • Der "Langsam-Denker" (Shared Convolution Expert): Dieser Experte ist wie ein erfahrener Architekt. Er schaut sich die gesamte Linie an und sorgt dafür, dass der langfristige Trend (z. B. "es wird im Winter kälter") stabil und zusammenhängend bleibt. Er kümmert sich um die "große Linie".
    • Die "Musiker" (Routed Fourier Experts): Diese Experten sind wie Geiger oder Trommler. Sie sind darauf spezialisiert, rhythmische Muster und schnelle Schwankungen zu erkennen (wie die täglichen Temperaturschwankungen oder wöchentliche Zyklen). Sie hören auf die "Frequenzen" der Daten.

Wie es funktioniert: Wenn eine neue Information hereinkommt (ein "Patch" der Zeitreihe), entscheidet ein cleverer Manager (der "Router"), welcher Experte sie bearbeiten soll.

  • Ist es ein langfristiger Trend? -> Der Architekt macht weiter.
  • Ist es ein schneller, rhythmischer Rhythmus? -> Die Musiker übernehmen.
  • So wird jedes Problem von dem Spezialisten gelöst, der dafür am besten geeignet ist.

2. Der Blick von außen (Exogene Covariaten)

Manchmal reicht der Blick auf die eigenen Daten nicht aus. Wenn Sie das Wetter vorhersagen wollen, hilft es, zu wissen, ob heute ein Feiertag ist oder ob ein Sturm im Nachbarland steht.

MoHETS hat ein Fenster in die Außenwelt eingebaut. Es kann externe Informationen (wie Kalenderdaten oder Wetterdaten anderer Orte) aufnehmen und diese direkt mit den eigenen Daten verknüpfen.

  • Vergleich: Stellen Sie sich vor, Sie planen eine Party. Ein normales Modell schaut nur auf die letzten Partys. MoHETS schaut auch auf den Kalender ("Heute ist Weihnachten!") und weiß sofort, dass sich das Verhalten der Gäste ändern wird. Das macht die Vorhersage viel robuster.

3. Der effiziente Übersetzer (Convolutional Patch Decoder)

Am Ende muss das Team die Ergebnisse in eine klare Vorhersage umwandeln. Frühere Modelle nutzten dafür oft riesige, schwere Maschinen, die viel Energie fraßen und manchmal "überdachten" (Overfitting).

MoHETS nutzt einen schlanken, schlauen Übersetzer.

  • Vergleich: Statt eine riesige Bibliothek zu durchsuchen, um ein Wort zu finden, nutzt MoHETS einen schnellen, präzisen Scanner. Er behält die Struktur der Daten bei und wandelt sie effizient in die Zukunft um, ohne unnötigen Ballast. Das macht das Modell schneller und stabiler.

Warum ist das wichtig?

In der echten Welt müssen wir oft Dinge für lange Zeiträume vorhersagen:

  • Wie viel Strom wird in einer Stadt in einem Jahr verbraucht?
  • Wie entwickelt sich der Aktienmarkt?
  • Wie wirkt sich der Klimawandel auf die Ernte aus?

MoHETS ist wie ein Super-Orakel, das lernt, zwischen dem "Rauschen" (kleine, zufällige Schwankungen) und den echten Mustern zu unterscheiden. Durch die Aufteilung der Arbeit auf verschiedene Spezialisten (die Mischung aus heterogenen Experten) ist es genauer als alle bisherigen Modelle.

Das Ergebnis: In Tests hat MoHETS die bisherigen Besten um durchschnittlich 12% übertroffen. Es ist schneller, braucht weniger Rechenleistung und macht weniger Fehler – besonders bei langen Vorhersagen, wo andere Modelle oft ins Straucheln kommen.

Zusammenfassend: MoHETS ist wie ein gut organisiertes Orchester, bei dem jeder Musiker sein eigenes Instrument spielt, anstatt alle auf einer einzigen Trommel zu trommeln. Das Ergebnis ist eine harmonische und präzise Vorhersage der Zukunft.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →