Each language version is independently generated for its own context, not a direct translation.
Stell dir vor, du bist ein Super-Detektiv, der einen riesigen, chaotischen Archivkeller voller 32 dicker Aktenordner durchsuchen muss. Deine Aufgabe: Beantworte 300 sehr spezifische Fragen über den Energieverbrauch von KI-Systemen. Und das Tückische: Du musst nicht nur die richtige Antwort finden, sondern auch exakt sagen, auf welcher Seite in welchem Ordner du sie gefunden hast. Ein einziger Fehler oder eine erfundene Antwort (Halluzination) kostet dich Punkte.
Das ist die Herausforderung, die das Team Kohaku-Lab mit ihrem System KohakuRAG gemeistert hat. Sie haben damit den ersten Platz in einem großen Wettbewerb (WattBot 2025) belegt.
Hier ist die Erklärung, wie ihr System funktioniert, ganz ohne Fachchinesisch:
1. Das Problem: Der "flache" Haufen Papier
Normale Suchsysteme (wie ein einfacher RAG-Ansatz) schneiden die Aktenordner einfach in kleine, gleich große Stücke (wie Puzzleteile) und werfen sie in einen Haufen.
- Das Problem: Wenn du nach einer Information suchst, die eigentlich auf Seite 5 steht, aber das System hat sie in ein Stückchen auf Seite 45 geschnitten, verliert es den Kontext. Es weiß nicht mehr, dass das Puzzleteil eigentlich zu einem bestimmten Kapitel gehört. Zudem kann es passieren, dass das System die Antwort "erfindet", weil es unsicher ist, oder die falsche Seite zitiert.
2. Die Lösung: KohakuRAG – Der intelligente Bibliothekar
KohakuRAG geht einen ganz anderen Weg. Statt alles zu zerkleinern, baut es eine kluge Hierarchie auf.
A. Die Baum-Struktur (Der Organisationsplan)
Stell dir die Dokumente nicht als Haufen Papier vor, sondern als einen Baum:
- Der Stamm ist das ganze Dokument.
- Die großen Äste sind die Kapitel.
- Die kleineren Äste sind die Absätze.
- Die Blätter sind die einzelnen Sätze.
Das System versteht diese Struktur. Wenn es ein "Blatt" (einen Satz) findet, weiß es sofort, zu welchem "Ast" (Absatz) und welchem "Stamm" (Dokument) es gehört. So kann es die Antwort nicht nur finden, sondern auch exakt sagen: "Ich habe das auf Seite X im Kapitel Y gefunden." Das ist wie ein Bibliothekar, der nicht nur das Buch kennt, sondern auch genau weiß, in welchem Regal, auf welchem Fach und bei welcher Zeile die Information steht.
B. Der Übersetzer (Die Frage-Planung)
Manchmal fragt man etwas anders, als es im Buch steht.
- Du fragst: "Wie viel Strom verbraucht Google?"
- Im Buch steht: "Power Usage Effectiveness (PUE) von Google-Rechenzentren."
Ein normales System würde hier vielleicht nichts finden, weil die Wörter nicht übereinstimmen. KohakuRAG nutzt einen KI-Planer (einen kleinen Übersetzer), der deine Frage in mehrere Varianten umschreibt. Er denkt: "Vielleicht suchen sie nach 'Strom', 'Energieeffizienz' oder 'PUE'." Er stellt also nicht nur eine Frage, sondern vier oder mehr, um sicherzugehen, dass er nichts verpasst.
C. Der Konsens-Check (Die Jury)
Wenn das System eine Antwort generiert, passiert es oft, dass die KI unsicher ist und sagt: "Ich weiß es nicht" (obwohl die Antwort da wäre), oder sie erfindet etwas.
KohakuRAG macht das nicht nur einmal. Es lässt die KI die Aufgabe mehrmals (z. B. 9 Mal) unabhängig voneinander lösen, wie eine Jury.
- Wenn 7 von 9 Jurymitgliedern die gleiche Antwort geben und 2 sagen "Ich weiß es nicht", ignoriert das System die "Ich weiß es nicht"-Antworten (solange die Antwort da ist) und nimmt die Mehrheitsmeinung.
- Das verhindert, dass die KI aus Angst vor Fehlern einfach aufgibt, wenn die Antwort eigentlich im Text steht.
3. Warum haben sie gewonnen?
Das Team hat drei Dinge besonders gut gemacht:
- Struktur bewahren: Sie haben die Dokumente nicht zerschnitten, sondern als Baum organisiert. Das hilft, den Kontext zu behalten.
- Vielfalt bei der Suche: Sie stellen viele Fragen statt nur einer, um alle möglichen Wortwahl-Varianten abzudecken.
- Mehrere Versuche: Sie lassen die KI mehrmals raten und wählen die beste Antwort aus, anstatt sich auf einen einzigen Versuch zu verlassen.
Das Ergebnis
Auf einer Skala von 0 bis 1 erreichten sie 0,861. Das ist extrem hoch. Noch wichtiger: Sie waren das einzige Team, das sowohl im öffentlichen Test (wo alle sehen können, wie gut sie sind) als auch im geheimen Test (wo die Fragen erst am Ende bekannt gegeben werden) Platz 1 belegten.
Zusammenfassend:
Statt wie ein Panzer durch einen Papierberg zu fahren und alles zu zertrümmern, hat KohakuRAG wie ein geschickter Architekt gearbeitet. Er hat die Dokumente strukturiert, hat sich mehrere Fragen überlegt, um sicherzugehen, und hat am Ende die Antwort einer ganzen Jury abgehört, um sicherzustellen, dass sie stimmt. So wurde das Chaos in eine präzise, zuverlässige Antwort verwandelt.