SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Each language version is independently generated for its own context, not a direct translation.

Das Problem: Der riesige Stapel Aktenordner

Stell dir vor, du bist ein Detektiv, der eine komplexe Frage beantworten muss. Zum Beispiel: „Wie hat sich die finanzielle Gesundheit von Firma X über die letzten 10 Jahre entwickelt, und welche Risiken gab es in den wissenschaftlichen Studien dazu?"

Um das zu beantworten, musst du nicht nur ein Buch lesen, sondern 100 verschiedene Ordner durchwühlen. Jeder Ordner ist ein Dokument (ein Jahresbericht, eine Studie, ein Artikel).

Das Problem mit den alten Methoden:

Der „Alles-lesen"-Ansatz (Full Context): Du versuchst, alle 100 Ordner gleichzeitig auf einen riesigen Tisch zu legen und sie in einem Rutsch zu lesen. Das ist wie der Versuch, einen Ozean in einem Schluck zu trinken. Dein Gehirn (der Computer) wird überfordert, vergisst wichtige Details in der Mitte und macht Fehler.
Der „Zufallsjäger"-Ansatz (Normal RAG): Du wirfst einen Fischernetz in den Ozean der Dokumente, fängst die ersten 5 Fische, die du siehst, und hoffst, dass die Antwort darunter ist. Oft fehlen aber genau die entscheidenden Informationen, die in den anderen 95 Ordnern stecken.

Die Lösung: SPD-RAG – Das spezialisierte Team

Die Forscher von SPD-RAG haben eine clevere Idee entwickelt, die wie ein gut organisiertes Bauteam funktioniert. Statt dass eine Person alles allein macht, teilen sie die Arbeit auf.

1. Der Bauleiter (Der Koordinator)

Zuerst kommt ein intelligenter Bauleiter (der „Coordinator"). Er liest deine Frage und zerlegt sie in kleine, klare Aufgaben.

Analogie: Er sagt nicht: „Sucht die Antwort!"
Sondern er sagt: „Team A, schaut in Ordner 1 nach den Zahlen für 2020. Team B, schaut in Ordner 2 nach den Risiken. Team C, prüft Ordner 3 auf Widersprüche."

2. Die Spezialisten (Die Sub-Agenten)

Jetzt wird es spannend. Für jeden einzelnen Ordner wird ein eigener, spezialisierter Mitarbeiter (ein „Sub-Agent") eingesetzt.

Das Geniale daran: Jeder Mitarbeiter sitzt in einem abgeschirmten Raum und darf nur seinen einen Ordner öffnen. Er darf nicht in die anderen Ordner schauen.
Warum ist das gut? Weil er sich zu 100 % auf seinen Ordner konzentrieren kann. Er sucht gründlich, liest jedes Detail und findet Dinge, die ein oberflächlicher Sucher übersehen würde. Er arbeitet parallel zu allen anderen – alle 100 Mitarbeiter arbeiten gleichzeitig an ihren eigenen Ordnern.

3. Der Zusammenführer (Die Synthese)

Am Ende kommen alle Mitarbeiter zurück und geben ihre Notizen ab.

Der Zusammenführer (die „Synthesis Layer") nimmt diese vielen kleinen Notizen und fügt sie zu einer großen, perfekten Antwort zusammen.
Der Trick: Wenn die Notizen zu lang werden, gruppiert er sie intelligent nach Ähnlichkeit (wie wenn man rote Socken und blaue Socken sortiert), bevor er sie zusammenfasst. So bleibt die Antwort kurz, aber vollständig.

Warum ist das besser? (Die Ergebnisse)

Die Forscher haben ihr System an einem sehr schwierigen Test (dem „Loong"-Benchmark) geprüft, bei dem es um lange Texte und viele Dokumente ging.

Das Ergebnis: SPD-RAG hat den alten „Zufallsjäger" (Normal RAG) um 76 % übertroffen!
Der Vergleich: Stell dir vor, der alte Weg fand nur 33 von 100 richtigen Antworten. SPD-RAG fand 58. Und das Beste: Es kostete nur etwa 38 % der Energie und des Geldes, die nötig wären, um alle Dokumente auf einmal zu lesen.

Die wichtigsten Lektionen in einfachen Worten

Spezialisierung schlägt Generalisierung: Es ist besser, 100 Experten zu haben, die sich jeweils um ein kleines Problem kümmern, als einen Super-Experten, der versucht, 100 Probleme gleichzeitig zu lösen.
Qualität durch Tiefe: Indem jeder Agent nur einen Dokumenten-Ordner durchsucht, findet er mehr Details, die sonst untergehen würden.
Geld sparen: Da die kleinen Agenten mit einem günstigeren, schnelleren Modell arbeiten können (weil sie nur einen kleinen Ordner lesen), spart man am Ende viel Geld, obwohl man mehr Schritte macht.

Fazit

SPD-RAG ist wie der Wechsel von einem einsamen, überarbeiteten Bibliothekar, der verzweifelt versucht, tausende Bücher auf einmal zu lesen, zu einem gut organisierten Team von Detektiven, die jeden Fall einzeln und gründlich lösen, bevor sie ihre Ergebnisse zu einem perfekten Fallbericht zusammenfügen.

Es ist der Beweis dafür, dass man bei großen Datenmengen nicht unbedingt mehr Rechenleistung braucht, sondern eine bessere Strategie, wie man die Arbeit aufteilt.

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Das Problem: Der riesige Stapel Aktenordner

Die Lösung: SPD-RAG – Das spezialisierte Team

1. Der Bauleiter (Der Koordinator)

2. Die Spezialisten (Die Sub-Agenten)

3. Der Zusammenführer (Die Synthese)

Warum ist das besser? (Die Ergebnisse)

Die wichtigsten Lektionen in einfachen Worten

Fazit

1. Problemstellung

2. Methodik: SPD-RAG Architektur

A. Koordinierungsschicht (Coordination Layer)

B. Parallele Abrufschicht (Parallel Retrieval Layer)

C. Synthese-Schicht (Synthesis Layer)

3. Schlüsselbeiträge

4. Ergebnisse

5. Bedeutung und Fazit

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Das Problem: Der riesige Stapel Aktenordner

Die Lösung: SPD-RAG – Das spezialisierte Team

1. Der Bauleiter (Der Koordinator)

2. Die Spezialisten (Die Sub-Agenten)

3. Der Zusammenführer (Die Synthese)

Warum ist das besser? (Die Ergebnisse)

Die wichtigsten Lektionen in einfachen Worten

Fazit

1. Problemstellung

2. Methodik: SPD-RAG Architektur

A. Koordinierungsschicht (Coordination Layer)

B. Parallele Abrufschicht (Parallel Retrieval Layer)

C. Synthese-Schicht (Synthesis Layer)

3. Schlüsselbeiträge

4. Ergebnisse

5. Bedeutung und Fazit

Mehr davon

One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers

ConFu: Contemplate the Future for Better Speculative Sampling

SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation

Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance