Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

Dit artikel introduceert SBARThez, een nieuw raamwerk dat multimodale en taalagnostische zinsembeddings combineert met een Named Entity Injection-mechanisme om hallucinaties te verminderen en nauwkeurige, abstracte samenvattingen te genereren voor zowel tekst als spraak in meertalige contexten.

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een heel dik, saai boek moet samenvatten voor een vriend die geen tijd heeft om het te lezen. Je wilt niet zomaar zinnen kopiëren en plakken (dat is saai), maar je wilt de kern van het verhaal in je eigen woorden vertellen. Dat is wat abstractive summarization (abstracte samenvatting) doet.

Maar hier zit een addertje onder het gras: soms verzinnen de slimme computers (AI) dingen die er niet zijn. Ze zeggen bijvoorbeeld: "De koning van Frankrijk heeft een nieuwe auto gekocht," terwijl in het originele verhaal helemaal niets over een koning of een auto stond. Dit noemen we hallucinaties.

In dit paper presenteren de auteurs een nieuwe manier om dit op te lossen, genaamd SBARThez. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De oude manier: Woord voor woord

Standaard kijken AI-modellen naar een tekst als een lange rij losse blokken (woorden). Ze proberen het volgende woord te raden, net als als je een zin afmaakt. Dit werkt goed, maar het is alsof je een boek leest door alleen naar de letters te staren, zonder echt de "smaak" van de zinnen te proeven.

2. De nieuwe manier: De "Zin als Pakketje"

De auteurs van SBARThez zeggen: "Waarom kijken we niet naar hele zinnen als één groot pakketje?"
In plaats van woorden, pakt hun systeem elke zin en verpakt deze in een digitale envelop (een zogenoemde sentence embedding). Deze envelop bevat de volledige betekenis van de zin.

  • De Analogie: Stel je voor dat je een hele maaltijd (de zin) niet als losse groenten en vlees (woorden) serveert, maar als een kant-en-klare, smakelijke maaltijd in een doos. De computer hoeft niet meer te rekenen aan de losse ingrediënten, maar kan direct proeven wat de maaltijd is.

Dit is slim omdat deze enveloppen taal-onafhankelijk zijn. Of de zin nu in het Frans, Chinees of Swahili is, de "smaak" (de betekenis) in de envelop is hetzelfde. Hierdoor kan het systeem een tekst in het Chineus lezen en direct een samenvatting in het Frans maken, zonder eerst een tussenstap te maken.

3. Het probleem: De verzonnen namen

Omdat het systeem zo creatief is met het "proeven" van de enveloppen, verzint het soms namen. Het zegt: "De president sprak," terwijl er in de tekst "De minister" stond.

4. De oplossing: De "Naam-Injectie" (NEI)

Om dit op te lossen, voegen de auteurs een truc toe: Named Entity Injection.

  • De Analogie: Stel je voor dat je een kok (de AI) een recept laat maken. Je geeft hem de enveloppen met de smaken, maar je plakt ook een lijstje met de juiste namen op zijn fornuis.
    • "Gebruik de naam Elon Musk, niet Bill Gates."
    • "Gebruik Parijs, niet Londen."

De AI krijgt dus de creatieve vrijheid om de zinnen te herschrijven, maar mag de namen op het lijstje niet veranderen. Hierdoor wordt de samenvatting creatief, maar wel eerlijk.

5. Wat kan het allemaal?

Dit systeem is niet alleen slim, maar ook veelzijdig:

  • Tekst: Het kan boeken en nieuwsartikelen samenvatten.
  • Spraak: Het kan zelfs naar een opname van een gesprek luisteren (zoals een telefoongesprek) en direct een samenvatting maken, zonder dat het eerst alles moet uitschrijven.
  • Kleine talen: Het werkt zelfs heel goed voor talen waar niet veel data over beschikbaar is (zoals bepaalde Afrikaanse talen), omdat het werkt met de "smaak" van de zinnen in plaats van miljoenen voorbeelden te moeten leren.

Samenvatting in één zin

SBARThez is een slimme samenvatter die niet naar losse woorden kijkt, maar naar de "smaak" van hele zinnen, en die een speciale lijst met namen bijhoudt om te voorkomen dat hij dingen verzonnet die er niet zijn. Hierdoor maakt hij kortere, creatievere en betrouwbaardere samenvattingen, zelfs als de bron in een andere taal is of als een opname is.