Conformalized Neural Networks for Federated Uncertainty Quantification under Dual Heterogeneity

Dit paper introduceert FedWQ-CP, een efficiënte methode voor conformale voorspelling in federatief leren die onder dubbele heterogeniteit betrouwbare onzekerheidskwantificering biedt door agenten en server in één communicatieronde te calibreren via gewogen aggregatie van lokale drempelwaarden.

Quang-Huy Nguyen, Jiaqi Wang, Wei-Shinn Ku

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een groot, wereldwijd ziekenhuisnetwerk hebt. Elke locatie (een "agent") heeft zijn eigen artsen, zijn eigen apparatuur en behandelt zijn eigen specifieke patiëntenpopulatie. Soms zijn de artsen superervaren met dure apparatuur (de "sterke agenten"), en soms werken ze in kleine dorpscentra met minder middelen (de "zwakke agenten").

Het probleem? Ze willen samenwerken om een slimme AI te bouwen die ziektes voorspelt, maar ze mogen nooit hun patiëntgegevens delen vanwege privacywetgeving. Dit noemen we Federated Learning.

De grote uitdaging is onzekerheid. Als de AI zegt: "Ik ben 95% zeker dat dit een tumor is," moet die 95% ook echt kloppen.

  • Bij een groot, goed uitgerust ziekenhuis is de AI misschien te zelfverzekerd (oververzekerd).
  • Bij een klein ziekenhuis met weinig data kan de AI juist te onzeker zijn of fouten maken zonder dat ze het merken (onderverzekerd).

Als je alleen naar het gemiddelde van het hele netwerk kijkt, lijkt alles perfect (bijvoorbeeld 95% zekerheid), maar dat verbergt het feit dat de kleine ziekenhuizen stiekem veel fouten maken. Dat is gevaarlijk.

De Oplossing: FedWQ-CP (De Slimme Kwaliteitscontroleur)

De auteurs van dit papier hebben een nieuwe methode bedacht genaamd FedWQ-CP. Laten we het uitleggen met een analogie:

1. Het Probleem: Verschillende "Taal"

Stel je voor dat elke arts een eigen taal spreekt om zijn zekerheid uit te drukken.

  • Arts A (Groot ziekenhuis) zegt: "Ik ben 90% zeker" (maar in zijn eigen taal betekent dat eigenlijk 99% zekerheid).
  • Arts B (Klein ziekenhuis) zegt: "Ik ben 90% zeker" (maar in zijn taal betekent dat misschien maar 80% zekerheid).

Als je deze getallen zomaar bij elkaar optelt (gemiddelde), krijg je een rommelig resultaat. De oude methoden probeerden dit op te lossen door alles naar één centraal punt te sturen, maar dat kostte te veel tijd en data, of het werkte niet goed als de artsen heel verschillend waren.

2. De Oplossing: De "Gewogen Stem"

FedWQ-CP werkt als een slimme moderator tijdens een vergadering:

  1. Lokaal Kijken: Elke arts (agent) kijkt eerst alleen naar zijn eigen patiënten. Hij berekent een drempelwaarde (een getal dat aangeeft hoe zeker hij moet zijn om een diagnose te stellen). Dit is zijn "lokale zekerheid".
  2. Alleen het Nodige Sturen: In plaats van alle patiëntgegevens te sturen, stuurt elke arts alleen twee kleine getallen naar de centrale server:
    • Zijn berekende drempelwaarde.
    • Het aantal patiënten waar hij naar heeft gekeken (de steekproefgrootte).
  3. Slim Aggregeren (De Magie): De server doet nu iets slimme: hij maakt een gewogen gemiddelde.
    • De arts met veel data (groot ziekenhuis) krijgt een zware stem.
    • De arts met weinig data (klein ziekenhuis) krijgt een lichtere stem.
    • Waarom? Omdat een arts met weinig data makkelijker een foutieve zekerheid berekent. Als je die stem te zwaar maakt, verpest je het resultaat voor iedereen.

3. Het Resultaat: Iedereen is veilig

Door deze methode te gebruiken, krijgt elke arts terug een globale drempelwaarde.

  • De grote ziekenhuizen krijgen een drempel die past bij hun sterke modellen.
  • De kleine ziekenhuizen krijgen een drempel die hen beschermt tegen hun eigen onzekerheid, zonder dat ze hun data hoeven te delen.

Het mooie resultaat:

  • Veiligheid: Geen enkel ziekenhuis (niet eens de kleine) heeft meer last van "stille fouten". Als de AI zegt dat het 95% zeker is, is het dat ook echt, voor iedereen.
  • Efficiëntie: De AI hoeft niet te twijelen als het niet nodig is. De "voorspellingsgroepen" (de lijst met mogelijke ziektes) blijven klein en scherp.
  • Snelheid: Het duurt slechts één ronde van communicatie. Geen eindeloze wachttijden of zware berekeningen.

Samenvattend in één zin

FedWQ-CP is als een slimme regisseur die zorgt dat een groep heel verschillende artsen samenwerken zonder hun geheimen te delen, waarbij hij rekening houdt met wie veel ervaring heeft en wie minder, zodat niemand een foutieve diagnose krijgt en iedereen evenveel vertrouwen heeft in het resultaat.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →