Detecting RAG Advertisements Across Advertising Styles

Diese Studie entwickelt eine Taxonomie für Werbestile in RAG-Systemen, simuliert Umgehungsversuche und zeigt, dass zwar Modelle auf Basis der Entitätserkennung robust gegen Stiländerungen sind, leichtere Modelle jedoch versagen, was weitere effizienzorientierte Forschung für die praktische Werbeblockade erfordert.

Sebastian Heineking, Wilhelm Pertsch, Ines Zelch, Janek Bevendorff, Benno Stein, Matthias Hagen, Martin Potthast

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der Forschung, als würde man sie einem Freund beim Kaffee erzählen – ohne Fachchinesisch, aber mit ein paar guten Bildern.

Das große Problem: Werbung, die sich wie ein echter Tipp verkleidet

Stell dir vor, du fragst einen sehr klugen KI-Assistenten (wie einen Chatbot): "Wo kann ich günstig wegfliegen?"
Der Assistent gibt dir eine ehrliche, hilfreiche Antwort. Aber plötzlich, mitten im Satz, schaltet er eine Werbung für eine Airline ein. Das Tückische: Die Werbung klingt nicht wie ein lautes Plakat, sondern wie ein natürlicher Teil des Gesprächs.

Das nennt man "Native Advertising" (eingebettete Werbung). Früher war das in Zeitungen üblich (Artikel, die wie Nachrichten aussahen, aber eigentlich Werbung waren). Jetzt macht das die KI. Das Problem für uns Nutzer: Wir merken oft gar nicht, dass wir gerade werblich unterhalten werden.

Was haben die Forscher gemacht?

Die Wissenschaftler von der Uni Kassel und anderen deutschen Unis wollten herausfinden: Können wir diese versteckte Werbung automatisch erkennen? Und noch wichtiger: Was passiert, wenn die Werbetreibenden versuchen, ihre Werbung noch besser zu verstecken?

Sie haben sich das wie ein Spiel "Katz-und-Maus" vorgestellt:

  • Die Maus (Werbetreibende): Versucht, die Werbung so zu schreiben, dass sie nicht auffällt.
  • Die Katze (Die KI-Detektoren): Versucht, die Werbung trotzdem zu finden.

Die vier Arten, wie Werbung "versteckt" werden kann

Die Forscher haben eine Art "Werbekochbuch" erstellt. Sie sagen, Werbung kann auf zwei Hauptachsen variieren:

  1. Wie laut ist sie? (Offen vs. Versteckt)

    • Offen (Overt): "Hey, kauf doch FUN Flights! Wir haben 15% Rabatt!" (Das ist wie ein lauter Verkäufer im Supermarkt).
    • Versteckt (Covert): "Vielleicht findest du bei FUN Flights eine gute Option für deinen spontanen Urlaub..." (Das ist wie ein leises Flüstern, das man leicht übersieht).
  2. Welches Gefühl soll sie wecken? (Kopf vs. Bauch)

    • Kopf (Rational): "Wir haben keine Kreditkartengebühren und fliegen von 21 Flughäfen." (Fakten, Zahlen, Logik).
    • Bauch (Emotional): "Fühlst du den Nervenkitzel eines spontanen Ausflugs? Wir bringen dich dorthin!" (Gefühle, Abenteuer, Träume).

Die Forscher haben nun simuliert, wie Werbetreibende ihre Texte ändern, um den Detektoren zu entkommen.

Das Experiment: Der Testlauf

Sie haben einen riesigen Datensatz mit KI-Antworten genommen.

  1. Training: Sie haben KI-Detektoren trainiert, um Werbung zu finden, die in einem bestimmten Stil geschrieben war (z. B. laut und sachlich).
  2. Der Test: Dann haben sie neue Werbung generiert, die ganz anders aussah (z. B. leise und emotional).
  3. Die Frage: Finden die alten Detektoren die neue, verkleidete Werbung noch?

Die Ergebnisse: Wer gewinnt?

Hier kommt es auf den "Detektor" an, den man benutzt:

  • Die "Dummen" Detektoren (Klassische Methoden):
    Diese arbeiten wie ein Wörterbuch. Sie suchen nach bestimmten Schlüsselwörtern (z. B. "Rabatt", "Kaufen").

    • Ergebnis: Wenn die Werbetreibenden die Wörter ändern (z. B. statt "Rabatt" schreiben sie "Schnäppchen"), sind diese Detektoren sofort blind. Sie sind wie ein Hund, der nur nach "Hund" riecht, aber nichts findet, wenn das Tier "Wauwau" heißt. Sie sind sehr empfindlich.
  • Die "Intelligenten" Detektoren (Moderne KI-Modelle):
    Diese Modelle lesen den ganzen Satz und verstehen den Kontext. Sie wissen, dass "FUN Flights" in diesem Zusammenhang wahrscheinlich eine Werbung ist, auch wenn das Wort "Werbung" gar nicht vorkommt.

    • Ergebnis: Diese sind sehr stark. Sie finden die Werbung, egal ob sie laut oder leise, emotional oder sachlich ist. Besonders ein Modell namens ModernBERT war ein Champion: Es hat fast immer die Werbung gefunden, selbst wenn die Werbetreibenden ihre Tricks änderten.
  • Die "Feinjustierung" (Wo genau ist die Werbung?):
    Es reicht nicht, nur zu sagen "Hier ist Werbung". Man muss genau wissen, welcher Teil des Textes die Werbung ist, um sie herausfiltern zu können, ohne den ganzen Text zu löschen.

    • Die besten Modelle können das auch ziemlich gut. Sie markieren genau die Wörter, die zur Werbung gehören (wie ein Textmarker).

Warum ist das wichtig?

Die Forscher sagen: Wir müssen uns darauf vorbereiten, dass unsere Chatbots bald voll mit Werbung sind.

  • Wenn wir keine guten "Werbefilter" haben, werden wir in Zukunft von KI-Texten umgeben sein, die wir nicht mehr von echten Informationen unterscheiden können.
  • Die Studie zeigt: Einfache Filter reichen nicht. Wir brauchen intelligente Systeme, die den Stil der Sprache verstehen, nicht nur einzelne Wörter.

Fazit in einem Satz

Die Forscher haben herausgefunden, dass einfache "Wort-Suchmaschinen" gegen neue, geschickte Werbe-Tricks versagen, aber moderne KI-Modelle, die den ganzen Text verstehen, wie ein guter Detektiv auch dann noch die versteckte Werbung entlarven können – solange die Werbetreibenden nicht noch raffiniertere Tricks erfinden. Es ist ein ewiges Katz-und-Maus-Spiel, bei dem wir die intelligenteste Katze brauchen.