Scaling Generalist Data-Analytic Agents

Die Arbeit stellt DataMind vor, ein skalierbares Trainingskonzept für generalistische Datenanalyse-Agenten, das durch eine innovative Datensynthese und einen stabilen Multi-Turn-Rollout-Framework den Open-Source-Modell DataMind-14B auf Benchmark-Leistungen führt, die proprietäre Spitzenmodelle wie GPT-5 übertreffen.

Shuofei Qiao, Yanqiu Zhao, Zhisong Qiu, Xiaobin Wang, Jintian Zhang, Zhao Bin, Ningyu Zhang, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen

Veröffentlicht 2026-03-16
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🧠 DATAMIND: Der neue „Allrounder" für Daten-Analysen

Stell dir vor, du hast einen riesigen, chaotischen Keller voller alter Kisten, Bücher und loser Blätter (das sind deine Daten). Du möchtest herausfinden: „Welches Jahr war das profitabelste?" oder „Gibt es einen Zusammenhang zwischen Wetter und Verkäufen?".

Bisher waren die KI-Modelle, die man dafür nutzen konnte, wie zwei extreme Typen:

  1. Die teuren Super-Experten (Proprietäre Modelle): Sie sind extrem klug, verstehen alles sofort, kosten aber ein Vermögen und sind wie ein verschlossener Safe – man kann nicht sehen, wie sie arbeiten.
  2. Die offenen, kostenlosen Helfer (Open-Source-Modelle): Sie sind kostenlos und offen, aber wenn man sie in den vollen Keller schickt, werden sie oft panisch. Sie verstehen große Datenmengen nicht gut, verlieren den Faden bei langen Aufgaben oder machen dumme Fehler beim Coden.

DATAMIND ist nun eine neue Methode, um aus einem kostenlosen Helfer einen echten Daten-Genie zu machen. Hier ist, wie sie das gemacht haben, mit ein paar lustigen Vergleichen:

1. Der Lehrplan: Vom „1+1" zum „Kochen eines Festmahls" 📚

Früher lernten KI-Modelle oft nur einfache Aufgaben. DATAMIND hat einen cleveren Lehrplan entwickelt.

  • Die Idee: Stell dir vor, du willst jemanden Kochen beibringen. Du fängst nicht mit einem 10-Gänge-Menü an. Du beginnst mit „Wie schneide ich eine Zwiebel?" (einfache Aufgabe). Dann machst du weiter mit „Wie kocht man eine Suppe?" (mittelschwere Aufgabe).
  • Die Methode: DATAMIND generiert automatisch Tausende von Fragen, die immer schwieriger werden. Sie kombinieren einfache Aufgaben zu komplexen Ketten (z. B. erst die Daten säubern, dann berechnen, dann vergleichen). So lernt das Modell, wie ein echter Analyst zu denken, statt nur Muster auswendig zu lernen.

2. Der Prüfer: Der „Doppel-Check" mit dem Schiedsrichter ⚖️

Wenn ein Schüler eine Matheaufgabe löst, kann er sich irren. Wie weiß man, ob die Lösung stimmt?

  • Das Problem: Oft generiert eine KI drei verschiedene Antworten, von denen zwei falsch und eine richtig ist.
  • Die Lösung: DATAMIND lässt die KI die Aufgabe dreimal lösen. Ein besonders kluger „Schiedsrichter" (ein anderes KI-Modell) prüft dann: „Sind alle drei Antworten im Kern gleich?" Wenn ja, wird die beste und kürzeste Antwort als perfektes Beispiel gespeichert. Wenn nein, wird die KI gebeten, nochmal nachzudenken und ihre Fehler zu korrigieren. So entsteht ein Trainingsbuch, das nur aus fehlerfreien Lösungen besteht.

3. Der Trainings-Coach: Zwischen „Stur lernen" und „Frei experimentieren" 🏋️‍♂️

Das Training von KI ist wie das Aufziehen eines Kindes oder das Trainieren eines Athleten.

  • Phase 1 (SFT - Supervised Fine-Tuning): Am Anfang gibt der Coach strikte Anweisungen. „Tu genau das, was im Buch steht!" Das gibt dem Modell Sicherheit und verhindert, dass es wild herumrätselt.
  • Phase 2 (RL - Reinforcement Learning): Wenn das Modell sicherer ist, sagt der Coach: „Okay, jetzt probiere es selbst aus! Wenn du eine gute Lösung findest, bekommst du einen Punkt."
  • Der Trick: Die DATAMIND-Forscher haben einen dynamischen Coach entwickelt. Er passt die Strenge live an. Wenn das Modell ins Wanken gerät, wird er wieder strenger. Wenn es gut läuft, lässt er mehr Spielraum für Experimente. So bleibt das Training stabil, ohne dass das Modell „verrückt" wird.

4. Der sichere Raum: Ein Labor mit Schutzanzug 🛡️

Datenanalyse erfordert oft das Ausführen von Code (Programmierbefehle). Das ist riskant, wie das Hantieren mit scharfen Messern in einer vollen Küche.

  • Das Problem: Wenn viele KIs gleichzeitig Code ausführen, kann der Computer überlastet werden oder abstürzen.
  • Die Lösung: DATAMIND baut für jede einzelne Aufgabe eine isolierte, sichere Zelle. Jede Aufgabe bekommt ihren eigenen kleinen Raum mit begrenztem Zeit- und Speicherlimit. Wenn eine Aufgabe zu lange dauert oder zu viel Speicher frisst, wird sie sofort gestoppt, ohne den ganzen Computer zu gefährden. So können Tausende von Aufgaben gleichzeitig trainiert werden, ohne dass das System kollabiert.

🏆 Das Ergebnis: Ein Open-Source-Wunderkind

Das Ergebnis dieser Methode sind zwei neue Modelle: DATAMIND-7B und DATAMIND-14B.

  • Die Leistung: Diese Modelle sind so gut, dass sie in Tests besser abschneiden als die teuersten, geschlossenen Modelle von Tech-Giganten (wie GPT-5 oder DeepSeek).
  • Die Bedeutung: Das ist ein riesiger Durchbruch. Es bedeutet, dass jeder – auch Forscher ohne Millionenbudget – Zugriff auf einen Daten-Analysten hat, der komplexe Tabellen, riesige Dateien und schwierige Fragen lösen kann.

Zusammengefasst:
DATAMIND hat nicht einfach nur mehr Daten gesammelt. Sie haben eine neue Art zu lernen erfunden: durch schrittweise Steigerung der Schwierigkeit, strikte Qualitätskontrolle durch einen Schiedsrichter und ein intelligentes Training, das Sicherheit und Kreativität perfekt ausbalanciert. Sie haben gezeigt, dass man mit der richtigen Methode auch aus einem „kleinen" Modell einen „großen" Meister machen kann.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →