RAFM: Retrieval-Augmented Flow Matching for Unpaired CBCT-to-CT Translation

Deze paper introduceert RAFM, een methode die Retrieval-Augmented Flow Matching toepast om ongepaarde CBCT- naar CT-translatie in de medische beeldvorming te verbeteren door semantisch consistente pseudo-paren te genereren, wat resulteert in superieure prestaties voor synthetische CT-generatie vergeleken met bestaande methoden.

Xianhao Zhou, Jianghao Wu, Lanfeng Zhong, Ku Zhao, Jinlong He, Shaoting Zhang, Guotai Wang

Gepubliceerd 2026-03-03
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een fotograaf bent die elke dag foto's maakt van een patiënt voor een stralingstherapie. Je hebt twee soorten camera's:

  1. De 'Gouden Standaard' (CT-scan): Deze maakt prachtige, scherpe foto's met de perfecte kleuren en helderheid. Hiermee kunnen artsen precies berekenen hoeveel straling ze moeten geven.
  2. De 'Werkcamera' (CBCT): Deze zit vast aan de stralingsmachine. Hij maakt foto's terwijl de patiënt op de tafel ligt, zodat de artsen precies weten waar ze moeten schieten. Maar deze foto's zijn vaak wazig, hebben rare vlekjes (artefacten) en de 'helderheidswaarden' kloppen niet. Je kunt ze dus niet direct gebruiken voor de berekening van de straling.

Het probleem:
Om de 'Werkcamera'-foto's om te zetten in 'Gouden Standaard'-foto's, zouden artsen idealiter een paar foto's nodig hebben van exact hetzelfde moment en exact dezelfde persoon. Maar dat is bijna onmogelijk. De patiënt beweegt, de organen veranderen van vorm, en de machines staan op verschillende plekken. Je hebt dus geen perfecte paren; je hebt alleen een stapel 'Werkcamera'-foto's en een stapel 'Gouden Standaard'-foto's van verschillende mensen op verschillende tijdstippen.

De oude oplossing (en waarom die faalt):
Vroeger probeerden computersystemen (zoals GANs) deze twee stapels met elkaar te vergelijken. Het was alsof je probeert een wazige foto van een man in een blauw overhemd om te zetten in een scherpe foto van een man in een rood overhemd, zonder dat je weet wie wie is. Het systeem raakt in de war, maakt rare keuzes en de resultaten zijn vaak onstabiel of onnauwkeurig.

De nieuwe oplossing: RAFM (De 'Slimme Zoeker')
De auteurs van dit paper hebben een nieuwe manier bedacht, genaamd RAFM. Ze gebruiken een slimme techniek die we "Flow Matching" noemen, maar dan met een extra trucje: Retrieval-Augmented (verrijkt met zoeken).

Hier is hoe het werkt, in simpele termen:

1. De 'Flow' (De Stroom)

Stel je voor dat je een rivier hebt. Aan de ene kant (bron) heb je de wazige CBCT-foto's. Aan de andere kant (doel) heb je de scherpe CT-foto's.
De oude methoden probeerden een brug te bouwen tussen willekeurige punten aan de bron en willekeurige punten aan de doelkant. Maar als je een wazige foto van een knie koppelt aan een scherpe foto van een hoofd, krijg je een rommelig resultaat.

Rectified Flow (de basis van hun methode) zegt: "Laten we een rechte lijn trekken tussen bron en doel." Maar in een kleine dataset (weinig patiënten) is het lastig om de juiste lijnen te vinden zonder dat je per ongeluk een knie aan een hoofd koppelt.

2. De 'Retrieval' (De Slimme Zoeker)

Hier komt de magie van RAFM om de hoek kijken. In plaats van willekeurig te zoeken, gebruikt het systeem een Slimme Zoeker (een AI die is getraind om beelden te begrijpen, genaamd DINOv3).

  • De Bibliotheek: Het systeem heeft een enorme digitale bibliotheek (een 'geheugenbank') vol met scherpe CT-foto's van verschillende mensen.
  • De Zoektocht: Als het systeem een wazige CBCT-foto van een knie krijgt, kijkt de Slimme Zoeker niet naar een willekeurige foto in de bibliotheek. Hij zoekt naar de foto die er het meest op lijkt qua structuur. Hij vindt een scherpe CT-foto van een knie (zelfs als die van een heel andere persoon is).
  • De Koppeling: Nu koppelt het systeem de wazige knie aan de scherpe knie. Dit is een 'pseudo-paar'. Het is geen echt paar van dezelfde persoon, maar het is wel een betrouwbare match.

3. Het Resultaat: Een Gladmakende Machine

Met deze slimme koppelingen leert het systeem een rechte, stabiele lijn (een 'flow') te volgen. Het weet precies hoe het de wazigheid moet weghalen en de kleuren moet corrigeren, omdat het steeds vergelijkt met de juiste 'doel' (bijvoorbeeld: "Hoe ziet een gezonde knie eruit?").

Waarom is dit zo goed?

  • Geen ruzie: Oude methoden waren als een gevecht tussen twee AI's (een maker en een criticus), wat vaak instabiel was. RAFM is als een rustige leraar die stap voor stap corrigeert.
  • Geen perfecte paren nodig: Je hoeft niet dezelfde patiënt op twee verschillende momenten te scannen. Het systeem is slim genoeg om te begrijpen dat een knie van persoon A op een knie van persoon B lijkt.
  • Sneller en scherper: De resultaten laten zien dat de nieuwe foto's veel scherper zijn, minder ruis hebben en de anatomie (de vorm van de organen) perfect behouden blijft.

Kort samengevat:
RAFM is als een slimme tolk die twee talen vertaalt (CBCT naar CT). In plaats van willekeurig woorden te vertalen, kijkt hij eerst in een woordenboek (de geheugenbank) om het beste synoniem te vinden dat past bij de context. Zo krijgt de patiënt een perfecte, scherpe foto voor zijn behandeling, zelfs als de oorspronkelijke foto's niet perfect waren.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →