VerifAI: A Verifiable Open-Source Search Engine for Biomedical Question Answering

Dit paper introduceert VerifAI, een open-source systeem voor biomedische vraag-antwoordtaken dat retrieval-augmented generation combineert met een post-hoc verificatiemechanisme om hallucinaties te minimaliseren en feitelijke consistentie te waarborgen.

Miloš Košprdic, Adela Ljajic, Bojana Bašaragin, Darija Medvecki, Lorenzo Cassano, Nikola Miloševic

Gepubliceerd 2026-04-13
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

VerifAI: De "Fact-Checker" die Zelf Antwoorden Schrijft

Stel je voor dat je een zeer slimme, maar soms wat verwarde bibliothecaris hebt. Deze bibliothecaris (een kunstmatige intelligentie) kan prachtige verhalen schrijven en complexe vragen beantwoorden. Maar er is een groot probleem: deze bibliothecaris is dol op het verzinnen van feiten. Hij kan een verhaal vertellen dat klinkt als waarheid, maar dat volledig uit de duim is gezogen. In de medische wereld, waar het leven van mensen op het spel staat, is dit gevaarlijk.

VerifAI is de oplossing voor dit probleem. Het is geen enkele robot, maar een slim team van drie specialisten die samenwerken om vragen over gezondheid te beantwoorden, waarbij elke bewering wordt gecontroleerd op waarheid.

Hier is hoe het werkt, vertaald naar alledaagse beelden:

1. De Zoeker (De "Boekworm")

Het eerste lid van het team is de Zoeker.

  • Hoe het werkt: Als je een vraag stelt (bijvoorbeeld: "Helpt medicijn X bij hoofdpijn?"), duikt deze robot niet in zijn eigen geheugen om iets te verzinnen. Nee, hij rent direct naar de grootste medische bibliotheke ter wereld (PubMed) en zoekt naar de 10 meest relevante wetenschappelijke artikelen.
  • De analogie: Het is alsof je een detective bent die niet op zijn intuïtie vertrouwt, maar eerst alle bewijsstukken verzamelt voordat hij een conclusie trekt. Hij gebruikt een slimme mix van "woordzoekers" (zoals Google) en "betekeniszoekers" (die begrijpen wat je bedoelt, zelfs als je de verkeerde woorden gebruikt).

2. De Schrijver (De "Verteller")

Het tweede lid is de Schrijver.

  • Hoe het werkt: Deze robot leest de 10 artikelen die de Zoeker heeft gevonden en schrijft een duidelijk antwoord voor jou. Maar hier is de truc: hij mag niet zomaar iets zeggen. Voor elke zin die hij schrijft, moet hij direct een "bewijsstuk" (een verwijzing naar het artikel) toevoegen.
  • De analogie: Stel je een journalist voor die een artikel schrijft. Een slechte journalist verzint quotes. Een goede journalist schrijft: "Zoals dokter Smith zegt in zijn artikel..." en geeft direct de bron. VerifAI's Schrijver is die perfecte journalist die elke uitspraak direct koppelt aan de bron.

3. De Controleur (De "Waarheidsfinder")

Dit is het meest unieke deel van VerifAI. Het derde lid is de Controleur.

  • Hoe het werkt: Nadat de Schrijver het antwoord heeft gemaakt, kijkt de Controleur elke zin na. Hij vergelijkt de zin van de Schrijver met het originele artikel.
    • Klinkt de zin als een logisch gevolg van het artikel? -> Groen licht (Waar).
    • Staat het artikel het tegen? -> Rood licht (Leugen).
    • Staat er niets over in het artikel? -> Grijs licht (Geen bewijs).
  • De analogie: Stel je een strenge leraar voor die een proefwerk nakijkt. De leraar heeft het originele boekje (het artikel) bij de hand. Als de leerling (de Schrijver) schrijft: "De aarde is plat", kijkt de leraar in het boekje, ziet dat het boekje zegt "De aarde is rond", en zet een dikke rode streep erdoor. VerifAI doet dit automatisch, seconde voor seconde.

Waarom is dit zo speciaal?

In de wereld van AI zijn er twee soorten robots:

  1. De "Grote Grootverdieners" (zoals GPT-4): Deze zijn enorm slim en kunnen over alles praten, maar ze zijn soms te zelfverzekerd en verzinnen feiten (hallucineren). Ze zijn als een zeer charmante leugenaar die je overtuigt met zijn verhaal.
  2. VerifAI's "Speciale Team": Ze gebruiken kleinere, gespecialiseerde robots. De Controleur is zo goed getraind op medische teksten dat hij de grote robots zelfs verslaat in het opsporen van leugens.

Het resultaat?
Wanneer je een vraag stelt aan VerifAI, krijg je niet zomaar een antwoord. Je krijgt een antwoord dat gekleurd is:

  • 🟢 Groen: Dit is bewezen door de bron.
  • 🟡 Oranje: Dit is deels waar, maar niet helemaal gedekt.
  • 🔴 Rood: Dit klopt niet met de bron (een leugen!).
  • Grijs: Hier is geen bron voor gevonden.

Je kunt met je muis over een zin gaan en zien: "Ah, dit staat in artikel nummer 12345, en de zin in dat artikel zegt precies hetzelfde."

De conclusie in één zin

VerifAI is als een onafhankelijke, onuitputtelijke en uiterst nauwkeurige medische onderzoeker die nooit iets verzint, omdat hij elke zin die hij schrijft direct laat controleren door de originele wetenschappelijke bronnen. Het maakt kunstmatige intelligentie veilig genoeg om te gebruiken in het ziekenhuis of in je eigen huis.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →