Estimation of relative risk, odds ratio and their logarithms with guaranteed accuracy and controlled sample size ratio

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je twee grote groepen mensen hebt: groep A en groep B. Je wilt weten hoe groot het verschil is tussen hen in een bepaalde eigenschap, bijvoorbeeld: "Hoeveel keer groter is de kans dat iemand in groep A ziek wordt vergeleken met iemand in groep B?"

In de statistiek noemen we dit de relatieve risico (RR) of de odds ratio. Het probleem is: je weet niet precies hoe groot deze groepen zijn of hoe vaak de ziekte voorkomt. Als je gewoon een vast aantal mensen uit beide groepen kiest, kan het zijn dat je te weinig data hebt als de ziekte zeldzaam is, of dat je te veel mensen hebt geïnterviewd als het heel vaak voorkomt. Je wilt dus een slimme manier om te meten die altijd nauwkeurig genoeg is, maar ook niet onnodig veel tijd of geld kost.

Dit artikel beschrijft een slimme methode om dit probleem op te lossen. Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen.

1. Het Probleem: Het Vissen in een onbekende vijver

Stel je voor dat je twee vijvers hebt (groep A en groep B) en je wilt weten hoeveel vissen er in de ene vijver zijn vergeleken met de andere.

De oude manier: Je gooit een net van een vaste grootte (bijv. 100 keer) in beide vijvers. Als er in de ene vijver maar 1 vis zit en in de andere 99, is je meting in de eerste vijver heel onnauwkeurig. Je hebt te weinig data.
De nieuwe manier (uit dit artikel): Je gebruikt een slimme, tweestaps-strategie. Je gooit eerst een klein netje, kijkt wat je vangt, en past je volgende actie daarop aan.

2. De Oplossing: Twee Stappen in een Dans

De auteur, Luis Mendo, stelt een methode voor die werkt als een tweestaps-dans met twee soorten netten:

Stap 1: De Verkenners (De Pilot)

Je gooit eerst een klein, vast aantal netten in beide vijvers. Dit is je "proefje".

Vergelijking: Stel je voor dat je twee teams stuurt om te verkennen. Team A vangt 5 vissen, Team B vangt 2 vissen.
Uit dit proefje bereken je een schatting: "Oh, het lijkt erop dat er in vijver A ongeveer 2,5 keer meer vissen zijn dan in B."
Dit proefje is niet perfect, maar het geeft je een idee van de verhouding.

Stap 2: De Hoofdaanval (De Aanpassing)

Nu gebruik je die schatting om te beslissen hoeveel extra netten je moet gooien.

Als je merkt dat de verhouding lastig te meten is (bijvoorbeeld omdat er heel weinig vissen zijn), gooi je meer netten.
Als het makkelijk te meten is, gooi je minder netten.
De magische truc: De methode zorgt ervoor dat je precies genoeg netten gooit om een garantie te krijgen. De fout in je meting is nooit groter dan een vooraf afgesproken grens (bijvoorbeeld: "Ik wil zeker weten dat mijn antwoord binnen 10% van het echte antwoord ligt").

3. De "Batterij" en de "Groep" (Element vs. Groep Sampling)

De paper bespreekt twee manieren om te vissen:

Element Sampling (Individueel vissen): Je gooit netten één voor één. Als je team A 100 netten nodig heeft en team B 50, gooi je precies 100 en 50. Dit is heel flexibel, maar in de praktijk is het soms lastig om mensen één voor één te vinden.
Group Sampling (In groepjes vissen): Stel je voor dat je niet één voor één kunt vissen, maar dat je alleen in pakketten van 10 mag vissen. Je gooit dan een pakket van 10 netten in beide vijvers tegelijk.
- Het probleem: Als team A 105 netten nodig heeft en team B 55, moet je 11 pakketten gooien (110 netten). Je gooit dan 5 netten in team A en 5 in team B weg (ze zijn "surplus").
- De oplossing in de paper: De auteur laat zien dat je dit slim kunt regelen. Je gooit de pakketten, bewaart de "extra" vissen voor later, en gooit pas een nieuw pakket als je echt niets meer hebt. Hierdoor verspil je niet veel, en houd je toch de verhouding tussen de twee groepen precies zoals je wilt.

4. Waarom is dit zo slim? (Efficiëntie)

Stel je voor dat je een Cramér-Rao grens hebt. Dit is een wiskundige "ondergrens" voor hoe goed een meting kan zijn. Het is als het theoretische maximum van een raceauto.

De methode in dit artikel rijdt bijna met die topsnelheid mee.
Als je een heel hoge nauwkeurigheid wilt (een heel klein foutmarge), is de methode bijna perfect efficiënt. Je verspilt geen enkele seconde of net.
Zelfs als je de verhouding tussen de twee groepen wilt controleren (bijv. "Ik wil altijd 2 keer zoveel mensen uit groep A als uit groep B"), lukt dit bijna perfect.

5. Samenvatting in één zin

Deze paper biedt een slimme, tweestaps-methode om het verschil tussen twee groepen te meten, die altijd een gegarandeerde nauwkeurigheid biedt, ongeacht hoe zeldzaam of vaak het fenomeen voorkomt, en die het aantal benodigde metingen zo klein mogelijk houdt door slim te schakelen tussen een verkenningsfase en een aanpassingsfase.

Kortom: Het is als een GPS-systeem voor statistiek. Het kijkt eerst even waar je bent (stap 1), en berekent dan de perfecte route (stap 2) om je precies op je bestemming (de juiste uitkomst) te krijgen, zonder onnodige omwegen (te veel metingen) of fouten (te weinig metingen).

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het artikel "Estimation of relative risk, odds ratio and their logarithms with guaranteed accuracy and controlled sample size ratio" van Luis Mendo, in het Nederlands.

Probleemstelling

Het artikel adresseert het statistische probleem van het schatten van de relatieve risico (RR), de odds ratio (OR), en hun logaritmische versies (LRR en LOR) uit twee onafhankelijke populaties met respectievelijk de kansen $p_1$ en $p_2$ op een binomiale gebeurtenis.

De uitdagingen in bestaande methoden zijn tweeledig:

Garantie van nauwkeurigheid: Traditionele schatters met een vast steekproefomvang kunnen niet garanderen dat de nauwkeurigheid (gemeten als relatieve gemiddelde kwadratische fout, RMSE, voor RR/OR, of absolute MSE voor logaritmische versies) onder een vooraf bepaald doelwaarde $A$ blijft voor alle mogelijke waarden van $p_1$ en $p_2$ . Vooral bij lage kansen faalt een vaste steekproefomvang.
Controle op steekproefverhouding: In veel toepassingen (bijv. klinische trials) is het wenselijk dat de verhouding tussen de steekproefgroottes van de twee populaties dicht bij een vooraf gespecificeerde verhouding $\lambda$ ligt, of dat steekproeven in gelijktijdige groepen (batches) worden genomen. Bestaande sequentiële methoden bieden vaak geen controle over deze verhouding.

Methodologie

De auteur stelt een tweestaps sequentiële schattingsprocedure voor die gebaseerd is op inverse binomiale steekproefneming (IBS). De methode werkt als volgt:

Fase 1 (Pilot-studie):
- Voor elke populatie wordt een eerste set steekproeven genomen totdat een vooraf vastgesteld aantal successen ( $r_1$ en $r_2$ ) is bereikt.
- De waargenomen steekproefgroottes ( $M_1, M_2$ ) worden gebruikt om een voorlopige schatting van de parameter (bijv. $\theta = p_1/p_2$ ) te maken.
- Op basis van deze voorlopige schatting worden de parameters voor de tweede fase berekend.
Fase 2 (Definitieve schatting):
- De parameters voor de tweede fase ( $s_1, s_2$ ) worden dynamisch berekend uit de resultaten van Fase 1.
- Het doel is om $s_1$ $s_{1}$ en $s_2$ $s_{2}$ zo te kiezen dat twee voorwaarden worden vervuld:
  - De nauwkeurigheid (variabiliteit) van de uiteindelijke schatter voldoet aan de doelwaarde $A$ .
  - De verhouding van de verwachte totale steekproefgroottes ( $E[M_1+N_1] / E[M_2+N_2]$ ) benadert de gewenste verhouding $\lambda$ .
- De parameters $s_1$ en $s_2$ worden vervolgens afgerond naar gehele getallen (omdat IBS discrete successen vereist).
Schatters:
- Voor RR en LRR: Er wordt gebruikgemaakt van onbevooroordeelde schatters gebaseerd op de verhouding van successen en steekproefgroottes.
- Voor OR en LOR: Omdat de OR afhangt van zowel successen als falen, wordt een Bernoulli-factory gebruikt in Fase 1 om steekproeven te genereren met een parameter gerelateerd aan $\bar{p}_i = p_i(1-p_i)$ . In Fase 2 worden twee IBS-processen per populatie uitgevoerd (één voor successen, één voor falen) om de odds nauwkeurig te schatten.
Groepssteekproefneming (Group Sampling):
- De methode kan ook worden toegepast wanneer steekproeven in batches van vaste grootte ( $l_1$ en $l_2$ ) worden genomen.
- Hierbij worden individuele steekproeven uit de batches gehaald naarmate nodig. Overschot wordt bewaard of verworpen. Dit garandeert een exacte verhouding van de steekproefgroottes, ten koste van een kleine toename in het gemiddelde aantal benodigde batches.

Belangrijkste Bijdragen

Garantie van Nauwkeurigheid: De voorgestelde schatters garanderen dat de relatieve MSE (voor RR/OR) of de MSE (voor LRR/LOR) strikt kleiner is dan een doelwaarde $A$ voor alle $p_1, p_2 \in (0,1)$ . Dit wordt bereikt door de adaptieve aard van de tweestapsprocedure.
Controle op Steekproefverhouding: De methode biedt controle over de verhouding van de gemiddelde steekproefgroottes, zodat deze dicht bij een voorgeschreven $\lambda$ ligt, ongeacht de onderliggende kansen.
Unbiased Schatters: Alle voorgestelde schatters zijn onbevooroordeeld (unbiased).
Efficiëntie: De efficiëntie van de schatters, gedefinieerd als de verhouding tussen de Cramér-Rao ondergrens en de werkelijke variantie, is hoog. Voor kleine waarden van $A$ nadert de efficiëntie 1, wat betekent dat de methode asymptotisch optimaal is.
Analytische Afleidingen: Het artikel levert nauwkeurige benaderingen en bovengrenzen voor de gemiddelde steekproefgroottes en het aantal benodigde groepen, evenals voor de efficiëntie.

Resultaten

De resultaten zijn gevalideerd via uitgebreide Monte Carlo-simulaties ($10^6$ realisaties per scenario):

Nauwkeurigheid: De empirische MSE voldoet consistent aan de doelwaarde $A$ . De schatters zijn conservatief; de werkelijke fout is vaak iets lager dan $A$ , vooral bij kleine $A$ .
Steekproefgrootte: De gemiddelde steekproefgroottes komen zeer dicht in de buurt van de theoretische ondergrenzen. De verhouding tussen de steekproefgroottes blijft zeer dicht bij de gewenste $\lambda$ (afwijkingen zijn meestal < 11%, en veel kleiner bij kleine $A$ ).
Efficiëntie: De schatters vertonen een hoge efficiëntie (vaak > 80% en naderend tot 100% voor kleine $A$ ).
Invloed van Parameters: De methode is robuust voor verschillende waarden van $\theta$ (de verhouding van de kansen) en $\phi$ (een maat voor de absolute grootte van de kansen). De "Bernoulli-factory" voor OR introduceert een kleine factor (3/2) in de steekproefgrootte, maar behoudt de gewenste eigenschappen.
Groepssteekproefneming: Deze variant leidt tot een kleine efficiëntieverlies (ongeveer 0,15 voor $A$ tussen 0,01 en 0,1) ten opzichte van elementaire steekproefneming, maar biedt de voordelen van gelijktijdige bemonstering en exacte verhoudingen.

Betekenis en Toepassing

Dit werk is significant voor statistische inferentie in medische en sociale wetenschappen, evenals in machine learning (logistieke regressie), waar het schatten van risico's en odds ratio's cruciaal is.

Klinische Trials: Het biedt een methode om trials te plannen waarbij de steekproefgrootte dynamisch wordt aangepast om een specifieke precisie te garanderen zonder onnodig veel proefpersonen te werven, terwijl de verhouding tussen behandel- en controlegroepen behouden blijft.
Robuustheid: In tegenstelling tot methoden met vaste steekproefgroottes, faalt deze methode niet bij zeldzame gebeurtenissen (lage $p$ ), omdat de steekproefgrootte automatisch toeneemt totdat voldoende successen zijn waargenomen.
Generaliseerbaarheid: De auteur geeft aan dat de methode kan worden uitgebreid naar andere functies van $p_1$ en $p_2$ , mits een geschikte "error function" en eventueel een Bernoulli-factory kunnen worden gedefinieerd.

Kortom, het artikel presenteert een wiskundig onderbouwde, praktische en efficiënte oplossing voor een klassiek probleem in de sequentiële statistiek, met een sterke focus op het garanderen van kwaliteit (nauwkeurigheid) en het beheersen van kosten (steekproefgrootte).

Estimation of relative risk, odds ratio and their logarithms with guaranteed accuracy and controlled sample size ratio

1. Het Probleem: Het Vissen in een onbekende vijver

2. De Oplossing: Twee Stappen in een Dans

Stap 1: De Verkenners (De Pilot)

Stap 2: De Hoofdaanval (De Aanpassing)

3. De "Batterij" en de "Groep" (Element vs. Groep Sampling)

4. Waarom is dit zo slim? (Efficiëntie)

5. Samenvatting in één zin

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Betekenis en Toepassing

Meer zoals dit

Hybrid Approximate Message Passing

Partial Sums of the Series for the Dirichlet Eta Function, their Peculiar Convergence, the Simple Zeros Conjecture, and the RH

Triangular arrangements on the projective plane

Some arithmetic properties of Weil polynomials of the form t2g+atg+qgt^{2g}+at^g+q^gt2g+atg+qg

Big Picard theorems and algebraic hyperbolicity for varieties admitting a variation of Hodge structures

Some arithmetic properties of Weil polynomials of the form $t^{2g}+at^g+q^g$