Trust via Reputation of Conviction

Dit paper introduceert een wiskundig raamwerk waarin vertrouwen wordt gebaseerd op de 'overtuiging' van bronnen – de kans dat hun standpunten worden bevestigd door onafhankelijke consensus – en toont aan dat continue verificatie en reputatie de enige robuuste basis vormen voor vertrouwen in foutgevoelige AI-agenten.

Aravind R. Iyengar

Gepubliceerd 2026-03-10
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat de wereld vol zit met mensen die feiten vertellen, maar niet iedereen zegt waarheid. Soms liegen ze, soms vergissen ze zich, en soms zeggen ze iets zo raars dat niemand het gelooft, totdat het bewezen is. Hoe weten we wie we kunnen vertrouwen?

Dit artikel van Aravind R. Iyengar (geschreven in de toekomst, 2026) geeft een slimme, wiskundige manier om dit probleem op te lossen, vooral voor AI's. Hier is de kern van het verhaal, vertaald naar gewoon Nederlands met een paar leuke vergelijkingen.

1. Wat is "Waarheid" eigenlijk?

In dit artikel wordt waarheid niet gezien als iets dat je in je hoofd hebt, maar als iets dat door iedereen samen kan worden gezien en nagekeken.

  • De Vergelijking: Stel je voor dat je een raadsel oplost. Als jij alleen zegt "Het antwoord is 42", is dat nog geen waarheid. Als jij het uitlegt en 100 andere mensen het zelfstandig narekenen en ook op 42 uitkomen, dan is het een waarheid.
  • De les: Waarheid is iets dat je kunt herhalen en dat onafhankelijke mensen kunnen controleren. Als iets alleen jij kunt zien (bijvoorbeeld "ik heb hoofdpijn"), is dat een gevoel, geen objectieve waarheid.

2. De twee rollen van een bron (een mens of een AI)

Elke bron die iets zegt, heeft twee taken:

  1. De Schepper: Iets bedenken of zeggen (een claim maken).
  2. De Scheidsrechter: Zelf kunnen oordelen of dat iets waar is.

Een goede bron moet beide kunnen. Een bron die alleen maar goed kan bedenken, maar niet kan oordelen, is als een kunstenaar die prachtige schilderijen maakt maar niet weet of ze mooi zijn. Een bron die alleen kan oordelen maar niets kan bedenken, is als een strenge leraar die alleen fouten vindt maar geen les kan geven.

3. Het geheim van vertrouwen: "Overtuiging" (Conviction)

Dit is het belangrijkste punt van het artikel. Meestal denken we: "Ik vertrouw iemand als hij altijd gelijk heeft." Maar dat is te streng, vooral voor AI's die leren en fouten maken.

In plaats daarvan moeten we kijken naar Overtuiging (Conviction).

  • Wat is het? Het is de kans dat jouw standpunt wordt bevestigd door anderen als ze het zelfstandig narekenen.
  • De Vergelijking: Stel je voor dat je een nieuw recept uitvindt.
    • Als je zegt: "Dit is het beste recept ter wereld" en niemand kan het narekenen of proeven, heb je geen reputatie.
    • Als je het recept deelt, en 100 andere koks proberen het, en 99 van hen zeggen: "Ja, dit werkt echt, het smaakt perfect!", dan heb je overtuiging.
    • Het maakt niet uit of het recept altijd perfect was in het verleden. Het gaat erom dat je bereid bent je werk te tonen en dat anderen het kunnen verifiëren.

Waarom is dit beter dan "altijd gelijk hebben"?
Omdat het AI's (en mensen) toestaat om nieuw te zijn. Soms zegt iemand iets wat eerst gek lijkt (een "non-intuïtieve" claim). Als die persoon het kan bewijzen en anderen het na kunnen doen, krijgt hij juist meer vertrouwen dan iemand die alleen maar herhaalt wat iedereen al weet.

4. Hoe bouw je een "Reputatie" op?

Reputatie is hier geen cijfer dat je in één keer krijgt (zoals een diploma). Het is meer zoals een spaarpot die langzaam vult.

  • De Regels:
    1. Transparantie: Je moet laten zien hoe je tot je conclusie komt. Je mag niet zeggen "Geloof me maar", je moet zeggen "Kijk hier, dit is mijn bewijs."
    2. De "Zelfstandige" claim: Je uitleg moet op zichzelf staan. Je mag niet zeggen "Kijk naar mijn vorige zin, die was waar," maar je moet de hele uitleg zelf kunnen geven.
    3. De Reputatie-formule: Elke keer dat je iets zegt en anderen bevestigen dat het klopt, krijg je punten. Als je iets zegt dat heel moeilijk te bewijzen is (een controversiële claim), krijg je pas punten als het definitief bewezen is. Als je liegt of fouten maakt, trekken ze punten af.

5. Wat betekent dit voor AI?

Dit artikel is geschreven voor de toekomst van AI. AI's zijn slim, maar ze maken ook fouten. Ze zijn als beginnende chef-koks die geweldige gerechten kunnen bedenken, maar soms de zoutmeter vergeten.

  • Het oude probleem: We proberen AI's te trainen zodat ze nooit fouten maken (perfectie). Dat lukt niet. We proberen ze ook te testen met een examen (een benchmark) voordat ze aan het werk gaan. Maar dat examen is vaak verouderd of de AI heeft het gewoon uit het hoofd geleerd.
  • De nieuwe oplossing: We moeten AI's niet zien als "perfecte machines", maar als bronnen met een reputatie.
    • Een AI moet elke keer dat het iets zegt, een "bewijs" leveren dat onafhankelijke mensen (of andere AI's) kunnen controleren.
    • We vertrouwen de AI niet omdat ze een diploma heeft, maar omdat ze in de loop van de tijd een spoor van bewezen overtuigingen heeft opgebouwd.
    • Als een AI een fout maakt, zakt haar reputatie. Als ze een briljant, nieuw idee heeft dat bewezen wordt, stijgt haar reputatie enorm.

Samenvatting in één zin

Vertrouwen is niet gebaseerd op het geloof dat iemand nooit fouten maakt, maar op de bewezen bereidheid om je werk openbaar te maken, zodat onafhankelijke mensen het kunnen controleren en bevestigen.

Voor AI betekent dit: Stop met zoeken naar de perfecte AI, en begin met bouwen aan een systeem waar elke AI zijn "reputatie" moet verdienen door transparant en controleerbaar te zijn.