TransactionGPT

Das Paper stellt TransactionGPT vor, ein auf einer 3D-Transformer-Architektur basierendes Fundamentmodell für Zahlungsdaten, das durch seine effiziente Verarbeitung von Milliarden-Transaktionen und überlegene Leistung bei Anomalieerkennung sowie Transaktionsvorhersage bestehende Modelle und feinabgestimmte LLMs in Bezug auf Genauigkeit und Geschwindigkeit übertrifft.

Yingtong Dou, Zhimeng Jiang, Tianyi Zhang, Mingzhi Hu, Zhichao Xu, Shubham Jain, Uday Singh Saini, Xiran Fan, Jiarui Sun, Menghai Pan, Junpeng Wang, Xin Dai, Liang Wang, Chin-Chia Michael Yeh, Yujie Fan, Yan Zheng, Vineeth Rakesh, Huiyuan Chen, Guanchu Wang, Mangesh Bendre, Zhongfang Zhuang, Xiaoting Li, Prince Aboagye, Vivian Lai, Minghua Xu, Hao Yang, Yiwei Cai, Mahashweta Das, Yuzhong Chen

Veröffentlicht 2026-03-04
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

TransactionGPT: Der „Super-Einkaufs-Experte" von Visa

Stell dir vor, du hast einen riesigen, unsichtbaren Freund, der jeden Einkauf, den du je gemacht hast, im Gedächtnis behält. Nicht nur, was du gekauft hast, sondern auch wann, wo, wie viel es gekostet hat und welche Kombination aus Umständen zu diesem Kauf geführt hat. Dieser Freund lernt aus Milliarden von solchen Momenten, um nicht nur zu verstehen, was du tust, sondern auch, was du als Nächstes tun könntest – und ob etwas dabei verdächtig aussieht.

Das ist im Grunde TransactionGPT (TGPT), ein neues KI-Modell von Visa Research. Hier ist die Erklärung, wie es funktioniert, ohne Fachchinesisch:

1. Das Problem: Ein chaotischer Daten-Ozean

Stell dir deine Einkaufshistorie wie ein riesiges, unordentliches Tagebuch vor.

  • Zeit: Die Einträge sind nicht gleichmäßig verteilt (manchmal kaufst du täglich, manchmal wochenlang nichts).
  • Vielfalt: Jeder Eintrag hat viele verschiedene Informationen: Der Name des Geschäfts (vielleicht eine Million verschiedene Namen!), die Kategorie (Bäckerei, Tankstelle), der Betrag, die Uhrzeit, die Währung.
  • Das Dilemma: Herkömmliche KI-Modelle sind wie Spezialisten. Ein Modell für Texte (wie Chatbots) versteht Wörter, aber keine Zahlen. Ein Modell für Tabellen versteht Zahlen, aber nicht die zeitliche Abfolge. Ein Modell für Zeitreihen versteht den Rhythmus, aber nicht die komplexen Details eines einzelnen Einkaufs.

TGPT ist der Universal-Detektiv, der all diese verschiedenen Datenformen gleichzeitig verstehen kann.

2. Die Lösung: Der 3D-Baukasten (Die Architektur)

Statt ein riesiges, schwerfälliges Gehirn zu bauen, das alles auf einmal versucht zu verstehen, hat Visa TGPT wie einen hochmodernen 3D-Baukasten konstruiert. Stell dir drei verschiedene Spezialisten vor, die in einem Team arbeiten:

  1. Der Zeit-Experte (Temporal Transformer): Er schaut auf die Reihenfolge. „Ah, Herr Müller geht immer samstags in den Supermarkt, aber heute ist er mittwochs in einer Tankstelle. Das ist ungewöhnlich!"
  2. Der Detail-Experte (Metadata Transformer): Er analysiert die einzelnen Einträge. Er versteht, dass „Bäckerei", „Müller" und „5 Euro" zusammengehören. Er kennt die Nuancen zwischen verschiedenen Geschäften.
  3. Der Kontext-Experte (Feature Transformer): Er bringt zusätzliches Wissen ein, das für spezifische Aufgaben wichtig ist (z. B. Risikobewertung).

Das magische Klebeband: Die „Virtuellen Token"
Das größte Problem bei solchen Modellen ist, dass die Datenmengen so unterschiedlich groß sind. Der Zeit-Experte braucht viele Informationen, der Detail-Experte hat aber nur kleine Datenpakete. Wenn man sie einfach zusammenklebt, wird es zu schwerfällig und langsam.

TGPT nutzt eine clevere Erfindung namens „Virtuelle Token". Stell dir das wie einen Übersetzer vor, der die kleinen, dichten Datenpakete des Detail-Experten in eine Sprache übersetzt, die der Zeit-Experte perfekt versteht, ohne dabei Informationen zu verlieren oder das System zu überlasten. Es ist, als würde man einen dicken Roman in eine prägnante Zusammenfassung verwandeln, die alle wichtigen Punkte enthält, aber leicht zu lesen ist.

3. Was kann TGPT eigentlich?

TGPT wurde mit Milliarden von echten Transaktionen trainiert. Das Ergebnis ist ein Modell, das zwei Hauptaufgaben meisterhaft erledigt:

  • Die Wahrsager-Funktion (Generierung):
    TGPT kann vorhersagen, was als Nächstes passiert. Wenn du heute Mittag in einem Restaurant warst, kann das Modell mit hoher Wahrscheinlichkeit erraten, wohin du morgen Abend gehen wirst.

    • Ein Beispiel: Das Modell lernte, dass Menschen, die in bestimmten Flughäfen essen, oft ähnliche Geschmacksrichtungen haben, auch wenn die Restaurants unterschiedlich heißen. Es erkennt Muster im Verhalten, die für uns Menschen unsichtbar sind.
  • Die Detektiv-Funktion (Betrugserkennung):
    Das ist der wichtigste Teil für Visa. Wenn jemand versucht, deine Karte zu missbrauchen, sieht TGPT sofort, dass etwas „falsch" ist.

    • Das Ergebnis: In Tests schlug TGPT die bestehenden Systeme im Unternehmen um 22 %. Es ist wie ein Wachhund, der nicht nur bellt, wenn jemand die Tür aufbricht, sondern schon merkt, wenn jemand nur anders als gewohnt die Tür öffnet.

4. Warum ist das besser als ein normaler Chatbot?

Man könnte denken: „Warum nutzen wir nicht einfach einen großen Sprach-KI-Modell (LLM) wie ChatGPT?"
Die Antwort ist: Effizienz und Kosten.

  • Ein Sprach-KI-Modell ist wie ein Dichter, der versucht, Mathematik zu lösen. Es kann es, aber es ist langsam, teuer und nicht auf Zahlen spezialisiert.
  • TGPT ist wie ein speziell ausgebildeter Finanz-Ingenieur. Er ist viel schneller (300-mal schneller als ein großes Sprachmodell), braucht viel weniger Rechenleistung und ist in seiner Aufgabe (Transaktionen verstehen) deutlich genauer.

Zusammenfassung

TransactionGPT ist ein neuer Standard für die KI in der Zahlungsbranche. Es ist kein einfacher Chatbot, sondern ein hochspezialisierter System-Architekt, der versteht, wie Menschen einkaufen, reisen und leben. Durch seine einzigartige Bauweise (die 3D-Architektur mit virtuellen Token) kann es riesige Datenmengen verarbeiten, ohne langsamer zu werden, und hilft dabei, Betrug zu verhindern und das Einkaufserlebnis für alle sicherer zu machen.

Es ist der Beweis dafür, dass man nicht immer den größten, schwersten KI-Modell braucht, sondern oft den schlausten und am besten angepassten.