EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records

Het artikel introduceert EveryQuery, een EHR-fundatiemodel dat via task-geconditioneerd pre-training zero-shot klinische voorspellingen mogelijk maakt door direct de waarschijnlijkheid van een uitkomst te schatten op basis van een patiëntgeschiedenis en een gestructureerde query, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van autoregressieve baselines, met name voor zeldzame klinische gebeurtenissen.

Payal Chandak, Gregory Kondas, Isaac Kohane, Matthew McDermott

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Het Grote Probleem: De "Voorspeller" die te traag is

Stel je voor dat je een superintelligente arts hebt die alle medische dossiers van miljoenen patiënten heeft gelezen. Deze arts kan ziektes voorspellen. Tot nu toe deden de slimste computersystemen dit op één specifieke manier: autoregressief.

De analogie van de "Droomreis":
Stel je voor dat je deze computer vraagt: "Zal deze patiënt binnen 30 dagen opnieuw in het ziekenhuis komen?"
De oude manier van werken is alsof de computer 20 verschillende droomtoekomstjes voor die patiënt droomt. In elke droom loopt het leven van de patiënt een maand door.

  • In droom 1: Hij komt niet terug.
  • In droom 2: Hij komt terug.
  • In droom 3: Hij komt niet terug...
    Na al die dromen telt de computer: "Oké, in 4 van de 20 dromen kwam hij terug. De kans is dus 20%."

De nadelen:

  1. Het is traag: Het dromen van 20 toekomstjes duurt lang.
  2. Het is onnauwkeurig bij zeldzame dingen: Als iets heel zeldzaam is (bijvoorbeeld 1 op de 100), dan zie je dat in 20 dromen misschien geen enkele keer gebeuren. De computer denkt dan: "Geen enkele droom liet het zien, dus de kans is 0%." Terwijl het misschien wel 1% is. Dat is gevaarlijk.
  3. Het is niet flexibel: Je kunt de computer niet simpelweg vragen: "Wat is de kans op een hartinfarct?" en dan later "Wat is de kans op een gebroken been?" zonder het hele droomproces opnieuw te starten.

De Oplossing: EveryQuery (De "Snelle Vraag-Antwoord Machine")

De auteurs van dit paper hebben een nieuwe manier bedacht, genaamd EveryQuery. In plaats van dromen, leert deze computer direct het antwoord op een specifieke vraag.

De analogie van de "Vraagspeler":
Stel je voor dat EveryQuery een super-snel antwoordmachine is.

  • Input: Je geeft de computer twee dingen:
    1. Het medische dossier van de patiënt (de geschiedenis).
    2. Een gestructureerde vraag (bijv. "Zal er binnen 30 dagen een code voor 'diabetes' verschijnen?").
  • Output: De computer kijkt één keer naar het dossier en de vraag, en zegt direct: "De kans is 85%."

Er wordt geen droomtoekomstje gegenereerd. Er is geen tellen van 20 scenario's. Het is één directe blik.

Waarom is dit zo geweldig? (De 3 Voordelen)

  1. Snelheid (Efficiëntie):

    • Oude manier: 20 dromen per patiënt = 6 seconden wachttijd.
    • EveryQuery: 1 directe blik = 0,02 seconden.
    • Analogie: Het is het verschil tussen het schrijven van 20 verschillende verhalen om te zien hoe een verhaal eindigt, versus gewoon direct het einde van het verhaal te lezen. EveryQuery is 3.000 keer sneller.
  2. Beter bij zeldzame ziektes:

    • Omdat EveryQuery niet hoeft te "dromen", maar direct kijkt naar signalen in het dossier die wijzen op een specifieke ziekte, mist hij zeldzame gebeurtenissen niet.
    • Analogie: De oude computer was als iemand die in een donkere kamer 20 keer een flitslampje aanzet om te zien of er een muis loopt. Als de muis zeldzaam is, zie je hem misschien nooit. EveryQuery is als iemand die direct een bewegingsmelder heeft die reageert op de muis, ongeacht hoe zeldzaam hij is.
  3. Flexibiliteit (Promptability):

    • Je kunt de computer vragen stellen alsof je een chatbot gebruikt. "Wat is de kans op X?", "Wat is de kans op Y?". Je hoeft de computer niet opnieuw te trainen voor elke nieuwe ziekte.

Wat is er mis? (De beperking)

Natuurlijk is er een addertje onder het gras. De "vraagtaal" van EveryQuery is op dit moment nog wat beperkt.

De analogie van de "Enkele Vraag":
EveryQuery is goed in vragen als: "Zal patiënt X specifiek ziekte A krijgen?"
Maar hij heeft moeite met vragen als: "Zal patiënt X welke ziekte dan ook krijgen?" of "Zal hij terugkomen om een van de 70 mogelijke redenen?"

In het paper wordt dit getest bij 30-daagse heropnames (patiënten die weer terugkomen). Om dit te beantwoorden, moet je eigenlijk vragen: "Komt hij terug voor reden A? Of reden B? Of C? ... Of Z?"
De computer moet dan 70 aparte vragen stellen en de antwoorden samenvoegen. Dat werkt niet zo goed als de oude "droomcomputer", die gewoon het hele toekomstbeeld ziet en ziet: "Ah, hij komt terug, ongeacht de reden."

Conclusie

EveryQuery is een doorbraak voor medische AI. Het is als het vervangen van een trage, dure droommachine door een razendsnelle, precieze vraag-antwoord machine.

  • Het is sneller (3.000x).
  • Het is betrouwbaarder bij zeldzame ziektes.
  • Het is makkelijker te gebruiken (je stelt gewoon een vraag).

De enige keer dat het faalt, is bij complexe vragen waarbij je "of-dit-of-dat" moet berekenen over honderden mogelijkheden. Maar voor de meeste medische voorspellingen is dit een enorme stap voorwaarts.