AERO: An AI Agent for Adaptive Eligibility Refinement and Optimization of Clinical Trial Criteria in Real-World Trial Emulation

Het artikel introduceert AERO, een AI-agentframework dat de geschiktheidscriteria voor klinische trials optimaliseert voor de emulatie van real-world data door gebruik te maken van grote taalmodellen om criteria systematisch te classificeren en te verfijnen, waardoor de generaliseerbaarheid en nauwkeurigheid van effectschattingsresultaten worden verbeterd, zoals aangetoond in een WARCEF-trial-emulatie.

Oorspronkelijke auteurs: Li, X., James, J., Pellikka, P. A., Zong, N.

Gepubliceerd 2026-05-01
📖 6 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Li, X., James, J., Pellikka, P. A., Zong, N.

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/). ⚕️ Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Stel je voor dat je probeert een beroemde, perfect gecontroleerde kookwedstrijd (een Randomized Controlled Trial, of RCT) na te bootsen met behulp van een gigantische, rommelige, echte voorraadkast vol ingrediënten uit duizenden verschillende huishoudens (jouw Elektronische Gezondheidsrecords).

In de originele wedstrijd hadden de juryleden een zeer strenge lijst met regels: "Gebruik alleen eieren van kippen jonger dan 2 jaar", "Geen zout als de kok een specifieke allergie heeft" en "De kok moet 4 uur zonder onderbreking kunnen staan". Deze regels zorgden ervoor dat de wedstrijd eerlijk was en de resultaten duidelijk.

Echter, wanneer je probeert deze exacte ingrediënten in de echte voorraadkast te vinden, loop je tegen een muur op. Je kunt de leeftijd van de kip niet alleen door naar het ei te kijken bepalen. Je hebt geen registratie van de allergiegeschiedenis van elke kok. En je kunt zeker niet weten of een kok 4 uur zou kunnen staan als ze dat nooit echt hebben hoeven doen. Als je probeert de originele regels exact zoals geschreven toe te passen, eindig je misschien met het weggooien van 90% van je voorraadkast, waardoor je bijna geen koks overhoudt om te bestuderen. Of erger nog, je houdt per ongeluk alleen de "perfecte" koks over, waardoor je resultaten er anders uitzien dan de echte wereld.

AERO: De Slimme Sous-Chef

Het artikel introduceert AERO (AI Agent for Adaptive Eligibility Refinement and Optimization). Denk aan AERO als een zeer intelligente, goed gelezen sous-chef die je helpt die strenge wedstrijdregels te vertalen naar iets werkbaars voor je rommelige echte voorraadkast, zonder de geest van de originele wedstrijd te verliezen.

Hier is hoe AERO werkt, met behulp van simpele metaforen:

1. Het "Vier-Vakken" Sorteersysteem

In plaats van blindelings elke regel te proberen te volgen, bekijkt AERO elke regel en vraagt: "Waarvoor dient deze regel echt?" Het sorteert elke regel in één van vier vakken:

  • Vak 1: De "Moeten" (Strikte Opname): Dit zijn de kernregels die definiëren waar de wedstrijd voor bedoeld is. Voorbeeld: "De kok moet soep maken." AERO houdt deze vast als harde filters. Als je geen soep maakt, ben je weg.
  • Vak 2: De "Veiligheidswaarschuwingen" (Strikte Uitsluiting): Dit zijn regels over gevaar. Voorbeeld: "Niemand met een ernstige notenallergie mag binnen." AERO houdt deze ook vast, omdat veiligheid niet onderhandelbaar is en meestal makkelijk te zien is in de registraties.
  • Vak 3: De "Achtergrondruis" (Verstorende Factoren): Dit zijn regels die de kok beschrijven maar hen niet noodzakelijkerwijs diskwalificeren. Voorbeeld: "De kok moet in het verleden een specifiek merk zout hebben gebruikt." In de echte wereld kan dit gewoon een factor zijn die de soep anders doet smaken, geen reden om de kok te verwijderen. AERO zegt: "Gooi ze niet weg! Schrijf dit gewoon op en pas het later aan wanneer we de soep proeven." Dit houdt meer mensen in de studie.
  • Vak 4: De "Onmogelijke Taken" (Verwerpen/Operationeel): Dit zijn regels die geen zin hebben in een echte voorraadkast. Voorbeeld: "De kok moet in staat zijn een 4-uursprotocol zonder onderbreking te volgen." Dit kun je niet controleren in een database. AERO zegt: "Dit kunnen we niet meten, dus laten we deze regel volledig laten vallen zodat we per ongeluk geen goede koks uitsluiten."

2. De "Kennismanager"

AERO raadt niet zomaar. Het fungeert als een bibliothecaris die drie verschillende boeken tevoorschijn haalt voordat een beslissing wordt genomen:

  • Een Medische Encyclopedie (UpToDate) om de ziekte te begrijpen.
  • Een Slimme AI-assistent (Claude) om de context te interpreteren.
  • Een Handboek voor Medicijnveiligheid (ToolUniverse) om te controleren op gevaarlijke interacties.

Door de originele proefregels te combineren met deze extra kennis, beslist AERO welke regels te behouden, welke aan te passen en welke te verwerpen.

3. De Proefrit: De WARCEF-proef

Om te zien of AERO werkt, gebruikten de onderzoekers het om de WARCEF-proef na te bootsen.

  • De Originele Proef: Vergelijkde Warfarine (een bloedverdunner) met Aspirine voor hartfalenpatiënten. Het resultaat? Geen verschil. De twee medicijnen werkten ongeveer even goed.
  • Het Probleem: Als je probeerde deze patiënten te vinden in echte ziekenhuisregistraties met de originele strenge regels, zou je waarschijnlijk een kleine, vreemde groep patiënten krijgen die niet leek op echte mensen.
  • De AERO-oplossing: AERO sorteerde de regels opnieuw. Het hield de diagnose hartfalen vast (Moet) en de veiligheidsuitsluitingen (Veiligheidswaarschuwing). Maar het verplaatste dingen zoals "recente pacemaker" of "specifieke medicatiegeschiedenis" naar het vak "Achtergrondruis", wat betekent dat ze die patiënten behielden maar de wiskunde later aanpasten.

Het Resultaat:
Toen ze de studie uitvoerden met de geoptimaliseerde regels van AERO, kregen ze een resultaat van HR = 1,56 (wat een statistische manier is om te zeggen "geen significant verschil"). Dit kwam overeen met de conclusie van de originele proef (HR = 1,01, "geen verschil").

De "Ablatie"-les (Het "Wat als"-experiment)
Het artikel voerde ook een cool experiment uit om te bewijzen waarom AERO's sortering ertoe doet. Ze namen één specifieke regel: "Geen patiënten op een specifieke bloedverdunner (LMWH)."

  • Scenario A (Strikte Regel): Ze gooiden iedereen die op die bloedverdunner zat uit de studie. Plotseling veranderden de resultaten! Het leek alsof één medicijn beter was dan het andere. Waarom? Omdat ze door die mensen weg te gooien, per ongeluk de ziekste patiënten verwijderden, waardoor de groep vertekend raakte.
  • Scenario B (De AERO-manier): Ze behielden die patiënten maar behandelden de bloedverdunner als "Achtergrondruis" om later voor aan te passen. Het resultaat ging terug naar "Geen verschil", overeenkomend met de originele waarheid.

De Grote Les

Het artikel beweert dat hoe je beslist wie in een studie terechtkomt, de resultaten verandert.

Als je probeert een strenge labproef te kopiëren en te plakken in de rommelige echte wereld, kun je het experiment kapotmaken. AERO fungeert als vertaler. Het gebruikt AI en medische kennis om te zeggen: "Deze regel gaat over veiligheid, houd hem vast. Deze regel gaat over logistiek, gooi hem weg. Deze regel is gewoon een kenmerk, pas er rekening mee."

Door dit te doen, stelt AERO onderzoekers in staat om echte ziekenhuisgegevens te gebruiken om vragen te beantwoorden waarvoor normaal gesproken dure, gecontroleerde proeven nodig zijn, terwijl ervoor wordt gezorgd dat het antwoord nog steeds accuraat en eerlijk is. Het overbrugt de kloof tussen de "perfecte wereld" van een lab en de "rommelige wereld" van een echt ziekenhuis.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →