FluxSieve: Unifying Streaming and Analytical Data Planes for Scalable Cloud Observability

Die Arbeit stellt FluxSieve vor, eine einheitliche Architektur, die durch die Einbettung einer leichtgewichtigen Vorverarbeitungs- und Filterungsschicht direkt in den Dateningestionspfad Streaming- und Analytik-Datenpläne vereint und damit bei vernachlässigbarem Speicher- und Rechenaufwand die Abfrageleistung in skalierbaren Cloud-Observability-Plattformen um Größenordnungen verbessert.

Adriano Vogel, Sören Henning, Otmar Ertl

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du betreibst eine riesige Bibliothek, in der jede Sekunde Millionen neuer Bücher (Daten) hereinkommen. Deine Aufgabe ist es, die Leser (die Analysten) so schnell wie möglich mit den richtigen Informationen zu versorgen.

Das ist genau das Problem, das die Forscher von Dynatrace mit FluxSieve lösen wollen. Hier ist die Erklärung in einfachen Worten, mit ein paar bildhaften Vergleichen:

Das Problem: Der "Suche im Heuhaufen"-Effekt

Stell dir vor, du hast einen riesigen Heuhaufen (deine Datenbank), der jeden Tag wächst. Ein Besucher kommt und fragt: "Ich suche nach einer einzigen, winzigen roten Nadel, die vor 3 Tagen in diesem Heuhaufen verloren ging."

  • Der alte Weg (Pull-Query): Der Bibliothekar muss den ganzen Heuhaufen durchwühlen, jedes Strohhalms einzeln prüfen und hoffen, dass er die Nadel findet. Wenn der Heuhaufen riesig ist, dauert das ewig. Außerdem muss er das jedes Mal machen, wenn jemand fragt, selbst wenn die Frage immer gleich ist. Das kostet viel Zeit und Energie.
  • Der reine "Live"-Weg (Stream Processing): Man könnte sagen: "Wir sortieren die Nadeln sofort aus, wenn sie hereinkommen!" Aber das ist kompliziert. Man braucht eine extra, sehr teure Maschine, die ständig läuft, und wenn sich die Suchregeln ändern (z. B. "Jetzt suche ich nach blauen Nadeln"), muss man die ganze Maschine neu aufbauen. Das ist unpraktisch.

Die Lösung: FluxSieve – Der intelligente Filter am Eingang

FluxSieve ist wie ein super-schneller, intelligenter Sieb-Mechanismus, den man direkt an den Eingang der Bibliothek baut, bevor die Bücher überhaupt ins Regal kommen.

  1. Das "Vorsortieren" (In-Stream Filtering):
    Wenn die neuen Daten (die Bücher) hereinkommen, läuft sie durch diesen Sieb-Mechanismus. Dieser Mechanismus kennt bereits die häufigsten Suchanfragen (z. B. "Alle roten Nadeln"). Er prüft die Daten sofort und klebt ein kleines Etikett darauf: "Hey, das hier ist eine rote Nadel!" oder "Das hier ist irrelevant, wir können es ignorieren."

    • Der Clou: Dieser Mechanismus ist extrem schlau. Er kann tausende verschiedene Suchmuster gleichzeitig prüfen, ohne langsamer zu werden.
  2. Die "Anreicherung" (Enrichment):
    Die Daten, die den Filter passieren, kommen nicht nur so ins Regal, sondern mit diesen kleinen Etiketten. Wenn ein Besucher später fragt: "Zeig mir alle roten Nadeln", muss der Bibliothekar nicht mehr den ganzen Heuhaufen durchsuchen. Er schaut nur auf die Etiketten und holt direkt die passenden Bücher.

    • Vergleich: Statt den ganzen Heuhaufen zu durchwühlen, hat man jetzt eine Liste, auf der genau steht, wo die roten Nadeln liegen.
  3. Die "Dynamik" (On-the-Fly Updates):
    Was, wenn der Besucher plötzlich sagt: "Ich suche jetzt nicht mehr nach roten, sondern nach goldenen Nadeln!"?
    Bei FluxSieve muss man die ganze Bibliothek nicht schließen. Der Filter am Eingang bekommt einfach eine neue Liste mit den goldenen Mustern und passt sich sofort an. Die Daten, die gerade hereinkommen, werden sofort anders etikettiert. Das passiert im laufenden Betrieb, ohne dass jemand warten muss.

Warum ist das so genial?

  • Geschwindigkeit: Die Suche ist um ein Vielfaches schneller (manchmal 60-mal schneller!). Die Bibliothek muss nicht mehr alles durchsuchen, sondern greift nur noch auf das vorfilterte Material zu.
  • Ressourcen: Der Filter am Eingang kostet zwar ein bisschen Strom (CPU), aber das ist wie ein kleiner Preis für einen riesigen Gewinn an Zeit bei der Suche.
  • Platz: Die Daten brauchen fast keinen zusätzlichen Platz. Die "Etiketten" sind winzig und lassen sich sehr gut komprimieren.
  • Einfachheit: Man braucht keine zwei getrennten, komplizierten Systeme (eines für das Live-Sortieren, eines für die Suche). Alles ist in einem System vereint.

Zusammenfassung in einem Satz

FluxSieve ist wie ein intelligenter Türsteher, der an der Bibliothekspforte sitzt. Er sortiert die Besucher (Daten) sofort nach ihren Interessen, bevor sie ins Gebäude kommen. Wenn jemand später nach etwas Bestimmtem fragt, muss das Personal nicht mehr das ganze Gebäude durchsuchen, sondern weiß genau, wo die gesuchten Dinge liegen – alles passiert automatisch, schnell und ohne Chaos.

Das macht riesige Datenmengen (wie sie in der modernen IT-Überwachung anfallen) endlich handhabbar und schnell durchsuchbar.