Comparative e-backtests for general risk measures

Deze paper introduceert een niet-parametrisch, sequentieel raamwerk voor het vergelijken van risicomaatstaven aan de hand van e-waarden, wat robuuste en altijd-geldende inferentie biedt voor financiële regelgeving, inclusief een verbeterde drie-zone-aanpak voor zwakke dominantie.

Zhanyi Jiao, Qiuqi Wang, Yimiao Zhao

Gepubliceerd 2026-03-06
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een veiligheidsinspecteur bent voor een grote bank. Je taak is om te controleren of de risicoberekeningen van de bank (hun "interne model") betrouwbaar zijn. Als de bank zegt: "We hebben maar een klein risico", moet jij weten of dat waar is of dat ze liegen.

Vroeger was dit een beetje als een zwarte doos: je keek alleen of de bank's voorspelling klopte met wat er daadwerkelijk gebeurde. Maar in de echte wereld is het ingewikkelder. Banken vergelijken hun modellen vaak met een "standaardmodel" van de toezichthouder. De vraag is dan niet alleen: "Is dit model goed?", maar: "Is dit model beter dan het standaardmodel?"

Dit papier introduceert een nieuwe, slimme manier om die vergelijking te maken, genaamd "E-backtesting". Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: De "P-waarde" is een statische foto

Traditionele methoden gebruiken iets dat een p-waarde heet. Stel je dit voor als een foto van een momentopname.

  • Je neemt een foto van de resultaten na een jaar.
  • Als de foto er slecht uitziet, zeg je: "Gevonden! Het model is fout."
  • Het nadeel: Als je tussendoor kijkt (bijvoorbeeld elke maand), mag je die foto niet meer gebruiken. Je moet wachten tot het einde. En als er een crisis komt (zoals in 2008 of tijdens COVID), werkt de oude methode vaak niet meer omdat de regels van het spel plotseling veranderen.

2. De Oplossing: De "E-waarde" als een levende thermometer

De auteurs van dit papier gebruiken iets nieuws: E-waarden (e-values).
Stel je dit voor als een levende thermometer of een speelgoed-schakelaar die je continu kunt bijhouden.

  • Je begint met een waarde van 1.
  • Elke dag die de bank een voorspelling doet, kijk je of het klopt.
  • Als het model goed is, blijft de thermometer stabiel.
  • Als het model fout is, stijgt de thermometer.
  • Het grote voordeel: Je mag op elk moment kijken! Als de thermometer op een bepaald punt (bijvoorbeeld 5 of 10) uit de bol gaat, weet je direct: "Stop! Dit model is niet goed." Je hoeft niet te wachten tot het einde van het jaar. Dit heet "altijd geldige inferentie" (anytime-valid inference).

3. De Vergelijking: Wie is de beste speler?

In dit papier vergelijken ze twee spelers:

  1. De Interne Speler: Het model van de bank.
  2. De Standaard Speler: Het model van de toezichthouder.

Ze spelen een spelletje waarbij ze wedden op wie de beste voorspellingen doet.

  • Als de Interne Speler wint, stijgt de "Interne Thermometer".
  • Als de Standaard Speler wint, stijgt de "Standaard Thermometer".

4. De "Drie-Kleuren Zone" (Het nieuwe idee)

Vroeger was het resultaat simpel: "Goed" of "Slecht". Maar de auteurs zeggen: "Het is vaak grijs." Ze introduceren een verkeerslichtsysteem met een extra kleur:

  • 🟢 Groen: De Interne Speler wint duidelijk. Het model is goed.
  • 🔴 Rood: De Standaard Speler wint duidelijk. Het model van de bank is slecht.
  • 🟡 Geel: Niemand wint duidelijk. Beide modellen doen het even slecht, of het is onduidelijk.
  • 🟠 Oranje (Het nieuwe idee): Dit is het slimme stukje. Soms wint de Interne Speler op de snelheid (hij wint sneller dan de ander), maar de Standaard Speler wint op de kracht (hij wint met een grotere marge).
    • Analogie: Stel je een renwedstrijd voor. De ene renner start sneller (snelheid), maar de andere heeft meer uithoudingsvermogen (kracht). De Oranje zone zegt: "Kijk goed uit, het is een spannende strijd, maar we kunnen nog wel een oordeel vellen op basis van wie er nu het beste presteert."

5. Waarom is dit zo handig? (De "Structuurveranderingen")

Financiële markten zijn als het weer. Soms is het zonnig, soms is er een orkaan.

  • Oude methode: Als er een orkaan komt, breekt je meetinstrument en weet je niets meer.
  • Nieuwe methode: Omdat je de "thermometer" continu kunt resetten, kun je zeggen: "Oké, de orkaan is voorbij, laten we de thermometer op nul zetten en opnieuw beginnen."
    • Dit betekent dat je kunt zien welk model het beste werkt tijdens een crisis en welk model het beste werkt in rustige tijden. Het ene model kan super zijn in normale tijden, maar faalt tijdens een crash. De andere doet het juist goed in chaos.

Samenvatting in één zin

Dit papier biedt toezichthouders en banken een slimme, levende thermometer die je continu kunt aflezen om te zien welk risicomodel het beste presteert, zelfs als de markt in paniek raakt, zonder dat je hoeft te wachten tot het einde van het jaar.

Het is alsof je van een statische foto van een race overgaat naar een live-stream waar je precies ziet wie er op dat moment de leiding heeft, zelfs als de raceplaatse verandert.