Detecting RAG Advertisements Across Advertising Styles

Deze paper introduceert een nieuwe taxonomie voor advertentiestijlen in RAG-systemen en toont aan dat modellen met entiteitsdetectie advertentievermeldingen effectief en robuust kunnen lokaliseren, terwijl lichtere modellen juist kwetsbaar blijken voor veranderingen in de advertentiestijl.

Sebastian Heineking, Wilhelm Pertsch, Ines Zelch, Janek Bevendorff, Benno Stein, Matthias Hagen, Martin Potthast

Gepubliceerd 2026-03-06
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Onzichtbare Reclame in je Chatbot: Een Jacht op Verborgen Boodschappen

Stel je voor dat je een slimme chatbot vraagt: "Wat zijn de beste last-minute reisdeals?" De bot geeft je een antwoord dat klinkt als een vriendelijk advies van een reisexpert. Maar schuilend in die tekst zit een verborgen advertentie voor een vliegmaatschappij. Dit is de nieuwe realiteit die deze paper onderzoekt: Reclame die zo natuurlijk in een antwoord is verwerkt dat je het nauwelijks ziet.

De auteurs van dit onderzoek (van universiteiten in Duitsland) willen weten: Kunnen we deze sluwe reclames nog opsporen, en wat gebeurt er als de adverteerders hun tactiek veranderen?

Hier is de uitleg, vertaald naar begrijpelijke taal met een paar creatieve vergelijkingen.

1. Het Probleem: De "Chameleons" van de Reclame

Vroeger was reclame makkelijk te herkennen: een felgekleurd banner op een website of een onderbreking in een televisieshow. Maar nu, met Large Language Models (LLM's), wordt reclame een chameleon.

De onderzoekers hebben ontdekt dat reclame twee belangrijke eigenschappen heeft die je kunt veranderen, net zoals een chameleon zijn kleur en patroon verandert om onzichtbaar te worden:

  • Hoe duidelijk is het? (Duidelijk vs. Verborgen)
    • Duidelijk: "Kijk eens naar FUN Flights, ze hebben 15% korting!" (Zoals een bordje dat je niet kunt missen).
    • Verborgen: "Misschien kun je bij FUN Flights een goede deal vinden..." (Zoals een speld in een hooiberg).
  • Wat is de boodschap? (Gevoel vs. Feit)
    • Gevoel: "Voel de kick van een spontane vakantie!" (Speelt in op je dromen).
    • Feit: "FUN Flights heeft geen creditcardkosten en vliegt vanaf 21 luchthavens." (Speelt in op je verstand).

2. De Simulatie: Een Kat-en-Muisspel

De onderzoekers hebben een groot experiment opgezet. Ze hebben een "reclamejager" (een computerprogramma) getraind op een bepaalde manier van reclame maken. Vervolgens hebben ze de "adverteerders" (de AI's die de reclames schrijven) gevraagd om hun stijl te veranderen.

Het is alsof je een hond traint om een specifiek soort bal te vinden, en dan plotseling de bal vervangt door een bal van een ander materiaal, of een andere kleur. Ziet de hond het nog steeds?

Ze hebben vier nieuwe stijlen gecreëerd (bijvoorbeeld: Verborgen + Gevoel of Duidelijk + Feit) en gekeken of de jagers deze nieuwe "bals" nog konden vinden.

3. De Resultaten: Wie is de beste jager?

Ze hebben verschillende soorten "jagers" (detectie-modellen) getest:

  • De "Grote Denkers" (Transformer-modellen): Dit zijn de slimme, zware AI-modellen (zoals ModernBERT).

    • Uitslag: Deze zijn uitstekend. Ze vinden bijna alle reclames, zelfs als de stijl verandert. Ze kijken naar de context, de zinsbouw en de subtiele patronen. Het is alsof ze de geur van de reclame ruiken, niet alleen de vorm.
    • Sterk punt: Ze zijn heel goed in het vinden van de exacte plek waar de reclame begint en eindigt.
  • De "Snelle Jagers" (Lichtgewicht modellen): Dit zijn simpele modellen (zoals Random Forests en SVM's) die bedoeld zijn om op je telefoon te draaien zonder veel batterij te kosten.

    • Uitslag: Deze zijn kwetsbaar. Als de reclame van stijl verandert (bijvoorbeeld van duidelijk naar verborgen), raken ze de draad kwijt. Ze kijken vaak alleen naar specifieke woorden (zoals "korting" of "koop"), maar als de adverteerder die woorden niet gebruikt, zien ze niets.
    • Metafoor: Het zijn als een hond die alleen reageert op het geluid van een fluitje. Als de adverteerder stopt met fluiten, is de hond blind.

4. De Belangrijkste Bevindingen

  1. Verborgen is harder te vinden: Reclames die zich verstoppen (covert) zijn veel moeilijker te detecteren dan die die openlijk zeggen wat ze zijn (overt).
  2. Gevoel is makkelijker te spotten: Curieus genoeg zijn reclames die spelen op emotie (zoals "voel de kick") makkelijker te vinden dan die puur met feiten werken. Waarschijnlijk omdat emotie meer unieke woorden gebruikt die opvallen.
  3. De "Nieuwe" AI's zijn slimmer: Als de adverteerders gebruikmaken van de nieuwste, sterkste AI-modellen om hun reclames te schrijven, worden ze nog slimmer in het ontwijken van de jagers.
  4. Woordniveau is cruciaal: De beste jagers kijken niet naar hele zinnen, maar naar woorden (tokens). Ze weten precies welk woordje de reclame vormt. Dit is essentieel voor een goede "reclameblokkering": je wilt niet de hele zin weggooien, maar alleen het stukje reclame.

Conclusie: De Toekomst

De boodschap van dit onderzoek is een waarschuwing en een oplossing.

  • Waarschuwing: Simpele blokkers die alleen op woorden letten, zullen snel verslaan worden door slimme, nieuwe reclamestijlen.
  • Oplossing: We hebben slimme, context-bewuste modellen nodig die de gehele tekst begrijpen.

Het is een voortdurend spelletje van kat en muis. Zolang adverteerders proberen zich te verstoppen in de tekst van je chatbot, moeten we blijven zoeken naar slimme manieren om die vermommingen te doorzien. De onderzoekers hopen dat hun werk helpt bij het bouwen van betere "reclameblokkers" voor de toekomst, zodat je chatbot-antwoorden eerlijk en zuiver blijven.