Handling onset age inconsistencies in longitudinal healthcare survey data

⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Hoe om te gaan met vergeten data in medische enquêtes: Een simpele uitleg

Stel je voor dat je een grote groep mensen vraagt: "Op welke leeftijd ben je voor het eerst ziek geworden?" Je vraagt dit nu, en je vraagt het weer over vijf jaar.

In de echte wereld is het menselijk geheugen niet perfect. Iemand zegt misschien: "Ik kreeg diabetes op mijn 45e," maar vijf jaar later zegt diezelfde persoon: "Oh, eigenlijk was ik 52." Dit noemen onderzoekers onduidelijkheid of inconsistentie. Het is alsof iemand een verhaal vertelt, maar de details veranderen elke keer dat hij het opnieuw vertelt.

Deze auteurs van het paper hebben twee slimme manieren bedacht om met deze verwarrende verhalen om te gaan, zodat artsen en onderzoekers betere conclusies kunnen trekken.

Methode 1: De "Betrouwbaarheids-meter" (De Kwaliteitscontroleur)

Stel je voor dat je een grote groep mensen hebt die een test doen. Sommige mensen zijn heel goed in het onthouden van details, anderen zijn wat slordig.

In plaats van iedereen te straffen of iedereen gelijk te behandelen, hebben de onderzoekers een betrouwbaarheidsscore bedacht.

Hoe werkt het? Ze kijken naar al de antwoorden van een persoon. Als iemand bij veel ziektes telkens andere leeftijden opgeeft, krijgen ze een lage score (ze zijn onbetrouwbaar). Als iemand consistent is, krijgen ze een hoge score.
Het resultaat: Je kunt nu de mensen in twee groepen splitsen: de "scharpe waarnemers" (hoge score) en de "dromers" (lage score).
Waarom is dit slim? Als je alleen kijkt naar de groep met de hoge scores, zie je veel duidelijke patronen. Het is alsof je door een wazige bril kijkt en dan ineens een scherpe bril opzet. De verbanden tussen ziektes (bijvoorbeeld: mensen met hoge bloeddruk hebben vaak ook hoge cholesterol) springen er veel duidelijker uit in de betrouwbare groep.

Voorbeeld: Stel je voor dat je een puzzel probeert te leggen. De ene helft van de puzzelstukken is van iemand die ze in de auto heeft laten vallen en beschadigd zijn (lage betrouwbaarheid). De andere helft is perfect. Als je alleen met de perfecte stukken werkt, zie je het plaatje veel sneller.

Methode 2: De "Bayesiaanse Rekenmachine" (De Slimme Schatting)

Soms wil je niet mensen uitsluiten, maar juist hun verwarde antwoorden verbeteren. Stel je voor dat je twee getuigen hebt die een getal moeten raden, maar beide maken een foutje.

De onderzoekers gebruiken een wiskundige truc (Bayesiaanse aanpassing) die werkt als een slimme schatting:

Het idee: Ze gaan ervan uit dat er één "echte" leeftijd is die de persoon bedoelt, maar dat de antwoorden "ruis" bevatten (foutjes door vergetelheid).
De berekening: Ze kijken naar hoe oud de persoon was toen hij het eerste antwoord gaf, en hoe oud hij was bij het tweede antwoord. Ze weten ook dat mensen ouder worden en dat het geheugen soms slechter wordt naarmate de tijd verstrijkt.
Het resultaat: De computer berekent de beste schatting van de echte leeftijd. Het is alsof je twee onnauwkeurige weegschalen hebt en je het gemiddelde neemt, maar dan gewogen op hoe betrouwbaar die schaal op dat moment was.

Voorbeeld: Stel je voor dat je de temperatuur van een kamer moet meten. Je hebt twee thermometers: één is een beetje oud en geeft soms 1 graad te hoog, de andere is nieuw maar staat in de zon. De "Bayesiaanse Rekenmachine" weet hoe deze thermometers werken en rekent de echte temperatuur uit, zelfs als de twee apparaten verschillende waarden aangeven.

Wat hebben ze ontdekt?

Toen ze deze methoden testten op data van meer dan 97.000 Canadezen, zagen ze twee dingen:

Betere voorspellingen: Als ze de betrouwbare groep gebruikten of de antwoorden corrigeerden, konden ze ziektes beter voorspellen. Het was alsof ze een wazige foto hebben scherpgesteld.
Duidelijker verbanden: De groepen met hoge betrouwbaarheid lieten zien welke ziektes echt met elkaar te maken hebben (bijvoorbeeld: hart- en vaatziekten clusteren samen). Bij de onbetrouwbare groep was dit een rommeltje.

Welke methode moet je kiezen?

De auteurs geven een handige gids:

Gebruik Methode 1 (De Score) als je heel veel data hebt. Je kunt dan gewoon de "slordige" mensen weglaten en werken met de "perfecte" groep. Dit is makkelijk en snel.
Gebruik Methode 2 (De Rekenmachine) als je weinig data hebt of als je geen mensen wilt uitsluiten. Hiermee kun je de bestaande data "opknappen" en toch een goed beeld krijgen, zelfs als de antwoorden niet perfect zijn.

Kortom: Mensen vergeten soms details over hun gezondheid. Deze paper leert ons hoe we die vergeten stukjes kunnen filteren of slim kunnen reconstrueren, zodat we de waarheid over ziektes beter kunnen begrijpen.

Each language version is independently generated for its own context, not a direct translation.

Titel: Omgaan met inconsistenties in de leeftijd van ziektebegin in longitudinale gezondheidsdata

1. Het Probleem

Langlopende gezondheidsenquêtes (zoals de Canadian Partnership for Tomorrow's Health of CanPath) zijn cruciaal voor het begrijpen van ziekte-etiologie en het ontwikkelen van voorspellende modellen. Een centrale variabele in deze studies is de zelfgerapporteerde leeftijd van ziektebegin (onset age).

Een veelvoorkomend probleem is de inconsistentie in de leeftijd van ziektebegin: deelnemers rapporteren vaak verschillende leeftijden voor dezelfde aandoening tussen de aanmelding (enrollment) en vervolg-enquêtes (follow-up). Dit is een vorm van meetfout veroorzaakt door geheugenverlies, recall-bias of onzorgvuldig invullen.

Huidige uitdagingen: Het verwijderen van inconsistente records leidt tot aanzienlijk data-verlies, terwijl het behouden ervan meetfouten introduceert die de effectschattingen verzwakken. Bestaande methoden (zoals deterministische regels of validatie op ziekteniveau) bieden geen statistisch onderbouwde correcties die rekening houden met leeftijdsafhankelijke meetfouten of participant-specifiek betrouwbaarheidsniveau.

2. Methodologie

De auteurs stellen twee methoden voor om deze inconsistenties aan te pakken, getest op data van 97.408 CanPath-deelnemers (waarvan 57,1% inconsistenties vertoonde):

A. Stratificatie op basis van betrouwbaarheidsscores (Reliability Score-based Stratification)
Deze methode creëert een participant-specifiek maatstaf voor betrouwbaarheid om deelnemers te groeperen.

Data Voorbereiding: Berekening van een matrix met leeftijdsverschillen ( $D_{ij}$ ) tussen follow-up en aanmelding voor alle aandoeningen.
Matrix Completering: Ontbrekende waarden worden ingevuld met SoftImpute (matrixfactorisatie), onder de aanname dat de grootte van de afwijking (niet de richting) de betrouwbaarheid bepaalt.
Dimensionaliteitsreductie: Principal Component Analysis (PCA) wordt toegepast op de absolute leeftijdsverschillen om de patronen van inconsistentie te comprimeren.
Score Constructie: Een ruwe betrouwbaarheidsscore ( $r_i$ ) wordt berekend als een gewogen som van de absolute component-scores. Hoge scores duiden op grotere afwijkingen (minder betrouwbaar).
Normalisatie en Stratificatie: Scores worden genormaliseerd naar [0,1] (waarbij hogere waarden nu meer betrouwbaarheid aanduiden na inversie). Deelnemers worden vervolgens gesplitst in een "hoog-betrouwbaar" en "laag-betrouwbaar" cohort (bijv. op basis van de mediaan).

B. Bayesiaanse Aanpassing (Bayesian Adjustment)
Deze methode corrigeert de data direct door meetfouten te modelleren.

Model: De waargenomen leeftijden bij aanmelding ( $X^{(e)}$ ) en follow-up ( $X^{(f)}$ ) worden gezien als ruisbevattende observaties van een latente, ware leeftijd van ziektebegin ( $X^*$ ).
Meetfoutverdeling: De fouten worden gemodelleerd als normaal verdeeld, waarbij de variantie afhangt van:
- De leeftijd op het moment van aanmelding (herinnering wordt slechter naarmate men ouder wordt).
- De tijdsduur tussen de enquêtes (herinnering verslechtert naarmate de tijd tussen metingen langer is).
Schatting: De parameters worden geschat via maximum likelihood op basis van de waargenomen leeftijdsverschillen.
Posterior Imputatie: De aangepaste waarde is het posterior gemiddelde, een precisie-gewogen gemiddelde van de twee observaties. De observatie met de lagere geschatte variantie (vaak de aanmelding) krijgt meer gewicht.

3. Belangrijkste Resultaten

Voor Stratificatie op Betrouwbaarheid:

Sterkere Correlaties: In het hoog-betrouwbare cohort waren de correlaties tussen biologisch gerelateerde aandoeningen (bijv. astma en hoge bloeddruk) consistent sterker dan in het laag-betrouwbare cohort.
Coherente Netwerken: Disease clustering-netwerken (gevisualiseerd met Louvain-algoritme) toonden in het hoog-betrouwbare cohort duidelijkere biologische clusters. Bijvoorbeeld, maag-darm aandoeningen en cardiovasculaire aandoeningen vormden in het hoog-betrouwbare cohort compacte groepen, terwijl ze in het laag-betrouwbare cohort verspreid waren.
Voorspellende Prestaties: Voor regressietaken (voorspellen van ziektebeginleeftijd) leverde het hoog-betrouwbare cohort aanzienlijk lagere fouten op (MAE verbetering van 1,4 tot 2,0 jaar). Voor classificatie waren de resultaten gemengd; bij mentale gezondheidsvariabelen (depressie) presteerde het laag-betrouwbare cohort soms beter, wat suggereert dat variabiliteit in mentale gezondheidsrapportage anders werkt.

Voor Bayesiaanse Aanpassing:

Verbeterde Correlaties: De Bayesiaanse aangepaste waarden leverden sterkere correlaties op dan zowel de oorspronkelijke aanmeldings- als follow-up-data voor biologisch gerelateerde paren (bijv. angst en depressie).
Voorspellende Verbetering: De aanpassing verbeterde consistent de prestaties van classificatie- en regressiemodellen.
Cumulatief Effect: De grootste winst werd gezien bij taken waarbij meerdere inconsistente variabelen tegelijkertijd werden aangepast (bijv. het voorspellen van diabetes op basis van zowel bloeddruk- als cholesterol-leeftijd). De MAE voor diabetes-voorspelling daalde met 18%.
Onzekerheid: De introductie van onzekerheid door de Bayesiaanse methode was beperkt (smalle 95% betrouwbaarheidsintervallen) ten opzichte van de winst in punt-schattingen.

4. Bijdragen en Significantie

Participant-niveau Betrouwbaarheid: Voor het eerst wordt een methode gepresenteerd om betrouwbaarheid op individueel niveau te kwantificeren in plaats van alleen op ziekteniveau, waardoor onderzoekers cohorts kunnen selecteren op datakwaliteit.
Statistisch Onderbouwde Correctie: De Bayesiaanse methode biedt een wiskundig onderbouwde manier om meetfouten te corrigeren die rekening houdt met de tijdsafhankelijkheid van herinnering, in plaats van te vertrouwen op vaste regels.
Praktische Richtlijnen: De auteurs bieden duidelijke richtlijnen voor onderzoekers:
- Gebruik stratificatie als de dataset groot genoeg is om een deel van de deelnemers (laag betrouwbaar) te verwijderen en eenvoudige implementatie gewenst is.
- Gebruik Bayesiaanse aanpassing bij beperkte steekproefomvang, wanneer onzekerheid moet worden doorgegeven aan inferenties, of bij variabelen met complexe variabiliteitspatronen (zoals mentale gezondheid).
Toepasbaarheid: De methoden zijn getest op een grote, nationale cohortstudie (CanPath) en hebben bewezen de kwaliteit van downstream analyses (associatie-onderzoek en machine learning) aanzienlijk te verbeteren.

Conclusie

De paper demonstreert dat het negeren of simpelweg verwijderen van inconsistente data suboptimaal is. Door ofwel deelnemers te stratificeren op basis van hun rapportage-consistentie, ofwel de data statistisch te corrigeren via een Bayesiaans model, kunnen onderzoekers de onderliggende biologische signalen versterken en de nauwkeurigheid van voorspellende modellen in de gezondheidszorg significant verbeteren.

Handling onset age inconsistencies in longitudinal healthcare survey data

Methode 1: De "Betrouwbaarheids-meter" (De Kwaliteitscontroleur)

Methode 2: De "Bayesiaanse Rekenmachine" (De Slimme Schatting)

Wat hebben ze ontdekt?

Welke methode moet je kiezen?

Titel: Omgaan met inconsistenties in de leeftijd van ziektebegin in longitudinale gezondheidsdata

1. Het Probleem

2. Methodologie

3. Belangrijkste Resultaten

4. Bijdragen en Significantie

Conclusie

Meer zoals dit

A case report on gendered biases in a Finnish healthcare AI assistant

Spine Reviews: Crowdsourcing Global Spine Expert Knowledge via Digital Ledger Technology

Individualised evoked response detection based on the spectral noise colour

Mechanistic Insights into Skin Sympathetic Nerve Activity Dynamics in Healthy Subjects Through a Two-Layer Signal-Analytical and Closed-Loop Physiological Modeling Framework

Wearable sleep staging using photoplethysmography and accelerometry across sleep apnea severity: a focus on very severe sleep apnea