Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models: Inhibitory Dominance, Biological Coherence, and Cross-Model Convergence

Each language version is independently generated for its own context, not a direct translation.

Titel: De "Wiring Diagram" van Cellen: Hoe AI de Biologie Leest

Stel je voor dat je twee super-intelligente robots hebt, Geneformer en scGPT. Deze robots hebben miljoenen pagina's biologische informatie (DNA, eiwitten, cellen) gelezen. Ze kunnen praten over hoe cellen werken, maar tot nu toe wisten wetenschappers niet hoe ze dat deden. Het was alsof je een zwarte doos zag die antwoorden gaf, maar je zag niet welke schakelaars er binnenin omhoog en omlaag gingen.

Deze paper is als het openmaken van die zwarte doos en het tekenen van een gedetailleerde stroomdiagram (een "circuit diagram") van hoe deze robots denken.

Hier is wat ze hebben ontdekt, vertaald in simpele taal:

1. De Methode: Het "Uitknippen" van Gedachten

De onderzoekers gebruikten een slimme truc. Ze keken naar de interne "gedachten" van de robots (deze noemen ze features). Ze deden alsof ze een specifieke gedachte uitknippen (ze zetten hem op nul) en keken toen wat er gebeurde met alle andere gedachten die daarop volgden.

De Analogie: Stel je een dominospel voor. Als je één dominosteen (een gedachte) omgooit, welke andere stenen vallen er dan ook om? En vallen ze om naar voren (excitatie) of blijven ze staan (inhibitie)?
Door dit te doen, konden ze zien hoe informatie door de lagen van de robot stroomt, van het begin tot het eind.

2. Het Grote Geheim: Alles is "Aan" of "Uit" (maar vooral "Uit")

Een van de meest verrassende ontdekkingen is dat de robots bijna alles remmen in plaats van aanmoedigen.

De Analogie: Stel je een orkest voor. In de meeste modellen denk je dat muzikanten elkaar aanmoedigen om harder te spelen. Maar deze robots werken meer als een geluidsregelaar. Als je één muzikant (een gedachte) stopt, dan moeten de anderen ook stoppen omdat ze afhankelijk zijn van die ene muzikant.
De bevinding: Ongeveer 80% van de verbindingen is "remmend" (inhibitorisch). Dit betekent dat de robots werken met een systeem van "noodzakelijke informatie". Als je een belangrijk stukje informatie weghaalt, stort het hele proces in.

3. Twee Verschillende Manieren van Denken

De twee robots (Geneformer en scGPT) hebben een heel ander "bouwpakket", maar ze komen op dezelfde plek uit.

Geneformer (De Architect): Deze robot is gebouwd rond chromatine en RNA (de bouwplannen van de cel). Hij werkt als een coöperatief team waar alles afhankelijk is van elkaar. Hij is voorzichtig en zorgvuldig.
scGPT (De Energiebeheerder): Deze robot is gebouwd rond energie en mitochondriën (de batterijen van de cel). Hij is competitiever en krachtiger. Hij heeft minder "gedachten" per laag, maar elke gedachte heeft een grotere impact.
De Conclusie: Het is alsof twee verschillende ingenieurs een brug bouwen. De ene gebruikt veel kleine bouten (Geneformer), de andere gebruikt minder, maar zwaardere stalen balken (scGPT). Beide bruggen staan echter stevig.

4. De Biologische "Hoofdpunten" (Hubs)

De onderzoekers zagen dat bepaalde gedachten de "hoofden" van het netwerk zijn.

Bij Geneformer zijn dit dingen als RNA-verwerking en cholesterol.
Bij scGPT zijn dit energieproductie en eiwitafbraak.
De Analogie: Stel je een stad voor. Bij Geneformer is de stad gebouwd rond de bibliotheek (informatie). Bij scGPT is de stad gebouwd rond het elektriciteitscentrale (energie). Als je de bibliotheek of de centrale platbrandt, valt de hele stad stil.

5. Wat Ze Wél en Niet Weten

Dit is het belangrijkste deel voor de toekomst:

Wat ze WEL weten: De robots hebben een perfect kaart van hoe biologische processen met elkaar verbonden zijn. Ze weten bijvoorbeeld dat "DNA-schade" leidt tot "celstop". Ze weten ook dat dit in de juiste volgorde gebeurt (eerst signaal, dan DNA, dan eiwitten).
Wat ze NIET weten: Ze weten niet precies welk specifiek gen een ander gen aan- of uitzet.
De Analogie: De robots weten dat "regen" leidt tot "natte straten". Maar als je ze vraagt: "Welke druppel regen heeft precies deze plassen veroorzaakt?", dan kunnen ze het niet precies zeggen. Ze zien de grote patronen, maar niet de microscopische oorzaak-gevolgrelaties tussen individuele moleculen.

6. Waarom is dit belangrijk?

Deze studie laat zien dat AI-modellen voor biologie niet zomaar "kletsen". Ze hebben een echte, logische structuur geleerd die overeenkomt met hoe de natuur werkt.

Ze hebben 1.142 verbindingen gevonden die beide robots onafhankelijk van elkaar hebben ontdekt. Dit betekent dat deze verbindingen waarschijnlijk echt waar zijn in de biologie.
Ze hebben ook nieuwe verbindingen gevonden die we nog niet kenden, zoals hoe energieproductie direct invloed heeft op hoe eiwitten worden vervoerd in de cel.

Kortom:
De onderzoekers hebben de "hersenen" van deze AI's ontrafeld. Ze hebben bewezen dat deze modellen geen toeval zijn, maar dat ze de complexe logica van het leven hebben geleerd. Ze werken als een soort biologische GPS: ze weten precies welke route je moet nemen om van A naar B te komen in de cel, zelfs als ze niet precies kunnen zeggen welke druppel water (welk gen) de weg nat heeft gemaakt.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het artikel "Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models" in het Nederlands.

Probleemstelling

Hoewel Sparse Autoencoders (SAE's) succesvol zijn gebruikt om de activeringen van foundation modellen te ontleden in interpreteerbare, monosemantische kenmerken (features), blijft de causale interactie tussen deze kenmerken over de diepte van het netwerk onbekend voor biologische foundation modellen. Bestaande methoden, zoals statistische co-activatie (Pointwise Mutual Information), kunnen correlatie van causaliteit onderscheiden noch de richting of grootte van informatieflow bepalen. Er is een gebrek aan inzicht in hoe deze modellen gene-level input causaal transformeren naar contextuele voorspellingen via interne circuits.

Methodologie: Causal Circuit Tracing

De auteurs introduceren een nieuwe methode genaamd Causal Circuit Tracing. Deze techniek breidt het concept van "activation patching" uit naar het niveau van SAE-kenmerken in biologische modellen.

Experimenteel Ontwerp:
- Modellen: De studie wordt toegepast op twee single-cell foundation modellen: Geneformer V2-316M (18 lagen) en scGPT whole-human (12 lagen).
- SAE's: Kenmerken worden afgeleid via Sparse Autoencoders die zijn getraind op de interne activeringen van deze modellen. Er worden vier experimentele condities getest:
  - Geneformer op K562-cellen met K562-specifieke SAE's.
  - Geneformer op K562-cellen met multi-tissue SAE's.
  - Geneformer op Tabula Sapiens (TS) cellen met multi-tissue SAE's.
  - scGPT op Tabula Sapiens cellen met native multi-tissue SAE's.
- Data: In totaal werden 96.892 causale randen (edges) geanalyseerd via 80.191 forward passes.
Tracing Algorithm:
- Voor een geselecteerd bronkenmerk (source feature) op een specifieke laag wordt de activatie geablateerd (op 0 gezet) tijdens een forward pass.
- De veranderingen in alle downstream kenmerken (doelkenmerken) op alle volgende lagen worden gemeten.
- Statistieken: Per bron-doelpaar wordt de Cohen's d (effectgrootte) en consistentie (hoe vaak de richting van het effect overeenkomt) berekend. Een rand wordt als significant beschouwd als $|d| > 0.5$ en consistentie $> 0.7$ .
Validatie:
- Vergelijking met onafhankelijke PMI-statistieken.
- Validatie op gen-niveau via CRISPRi-perturbatiedata (Replogle dataset).
- Mapping van ziekte-gerelateerde genen op de circuitarchitectuur.

Belangrijkste Bijdragen

Introductie van Causal Circuit Tracing: Een nieuwe methode om de gerichte computatiegrafieken van biologische foundation modellen in kaart te brengen op kenmerkniveau.
Ontdekking van Distincte Architecturen: Het aantonen dat Geneformer en scGPT fundamenteel verschillende computationele strategieën hanteren, ondanks hun gedeelde doel.
Systematische Kennisextractie: Het analyseren van bijna 100.000 randen om biologische cascades, temporele ordening en nieuwe biologische relaties te identificeren.
Validatie van "Biologische Coherentie": Het bewijzen dat de coherentie van circuits meer afhankelijk is van de SAE-training (de "lens") dan van het type invoercel.

Resultaten

1. Dichte, voornamelijk remmende (inhibitory) circuits

Beide modellen vertonen dichte computatiegrafieken waarbij één bronkenmerk gemiddeld 600–2.400 downstream kenmerken beïnvloedt.
Inhibitory Dominance: 65% tot 89% van de causale randen is negatief (remmend). Dit suggereert dat kenmerken noodzakelijke informatie coderen; het verwijderen ervan vermindert de activatie van afhankelijke kenmerken.
Effectgrootte: scGPT toont sterkere individuele effecten (gemiddelde $|d| = 1.40$ ) dan Geneformer ( $|d| = 1.05$ ), wat waarschijnlijk te wijten is aan de lagere dimensionaliteit van scGPT (2.048 features vs 4.608).

2. Distincte Organiserende Principes (Hubs)

Geneformer: Organiseert zich rond chromatine- en RNA-verwerking (bijv. Golgi-organisatie, RNA-methylering, RNA-splijting). De architectuur is meer "coöperatief" en afhankelijkheidsgericht.
scGPT: Organiseert zich rond mitochondriële energiemetabolisme (bijv. NADH-dehydrogenase, aerobe elektronentransportketen). Dit suggereert dat energiestatus een fundamentele variabele is die andere processen beïnvloedt. scGPT vertoont meer competitieve dynamiek (meer excitatoire randen).

3. Biologische Coherentie en Consensus

Coherentie: Ongeveer 53% van de causale randen verbindt kenmerken die ten minste één biologisch ontologische term (GO, KEGG, Reactome) delen. Dit percentage is opmerkelijk stabiel over beide modellen en verschillende celltypes heen.
SAE-afhankelijkheid: Multi-tissue SAE's verhogen de coherentie naar 68,8%, ongeacht of de invoer K562 of Tabula Sapiens cellen zijn. Dit toont aan dat de kwaliteit van de SAE-training (de "lens") cruciaal is voor interpreteerbaarheid.
Cross-Model Consensus: Er zijn 1.142 behouden domeinparen geïdentificeerd die in beide modellen voorkomen (10,6x meer dan bij toeval). Dit bevestigt dat beide modellen dezelfde onderliggende biologische waarheden hebben geleerd.

4. Temporele Ordening en Nieuwe Relaties

De netwerkdiepte volgt een biologische temporele volgorde: Signaleringscascades (MAPK, Ras) in vroege lagen $\rightarrow$ Chromatine-modificatie $\rightarrow$ Genexpressie-regulatie in late lagen.
Nieuwe Hypothesen: 29.864 "nieuwe" randen werden gevonden die niet in bestaande databases staan, zoals koppelingen tussen mitochondriale energie en eiwittransport, of Golgi-organisatie en ER-stress.

5. Validatie op Gen-niveau en Ziekte

CRISPRi Validatie: De voorspellingen op gen-niveau tonen slechts 56,4% directionele nauwkeurigheid (marginaal boven willekeur) en een verwaarloosbare correlatie in grootte. Dit bevestigt dat deze modellen voornamelijk co-expressie coderen en geen strikte causale regulatie op gen-niveau.
Ziekte-associatie: Ziekte-gerelateerde domeinen zijn significant centraler in het circuit en 3,59x vaker aanwezig in cross-model consensus. De modellen coderen ziekte-relevante biologie robuuster dan andere processen.

Significantie en Conclusie

De studie levert een doorbraak in de mechanistische interpreteerbaarheid van biologische foundation modellen:

Kenmerken als eenheid: Het bewijst dat SAE-kenmerken de natuurlijke eenheid van biologische berekening zijn in deze modellen, terwijl ablating op component-niveau (zoals attention heads) vaak geen effect heeft.
Universele principes: De stabiliteit van biologische coherentie (~53%) en de inhibitory dominantie suggereren universele principes van hoe transformers biologische data verwerken.
Hypothesegeneratie: Hoewel de modellen geen perfecte mechanistische voorspellers zijn voor individuele gen-perturbaties, bieden ze een betrouwbaar "kaartje" van biologische processen en hun onderlinge relaties. Dit maakt ze krachtige tools voor het genereren van nieuwe biologische hypotheses, vooral voor cross-compartmentele interacties en ziekte-mechanismen.
Invloed van SAE: De keuze van de SAE-trainingdata (bijv. multi-tissue vs. single-tissue) heeft een grotere impact op de interpretatie van de circuits dan het type invoercel zelf.

Kortom, deze paper onthult dat single-cell foundation modellen complexe, biologisch coherente circuits hebben geleerd die de temporele volgorde van biologische processen nabootsen, maar dat hun voorspellende kracht op gen-niveau beperkt blijft tot het vastleggen van co-expressiepatronen.