Sparse autoencoders reveal organized biological knowledge but minimal regulatory logic in single-cell foundation models: a comparative atlas of Geneformer and scGPT

⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je twee zeer slimme, geavanceerde computerprogramma's hebt die zijn getraind om de taal van het leven te begrijpen: Geneformer en scGPT. Deze programma's hebben miljoenen cellen "gelezen" en lijken alles te weten over hoe genen samenwerken. Ze kunnen voorspellen wat er gebeurt als je een cel verandert, net als een super-intelligente bioloog.

Maar er is een groot vraagteken: Begrijpen ze echt waarom dingen gebeuren, of onthouden ze alleen patronen?

Stel je voor dat je een boek leest waarin elke zin begint met "De zon schijnt". Als je daarna een zin ziet met "De zon schijnt", weet je dat de volgende zin waarschijnlijk over een zonnige dag gaat. Dat is een patroon. Maar als je vraagt: "Waarom schijnt de zon?", en het boek geeft je alleen maar meer zinnen over zonnige dagen zonder de oorzaak (de aarde die draait) te noemen, dan heeft het boek het patroon wel gezien, maar niet de echte oorzaak.

Deze studie, geschreven door Ihor Kendiukhov, onderzoekt precies dit: Zien deze AI's de echte "regels" van het leven (wie regelt wie), of zien ze alleen de "statistieken" (wie komt vaak samen voor)?

Om dit te ontdekken, gebruikte de auteur een nieuwe techniek die hij SAE noemt (een soort "ontwarrelingstool"). Hier is hoe het werkt, vertaald naar alledaagse termen:

1. Het probleem: De "Superpositie" (De rommelige koffer)

Deze AI's werken met een beperkt aantal "ruimte" (nummers) om alle informatie op te slaan. Omdat ze zoveel moeten onthouden (duizenden genen, pathways, processen), proppen ze alles in dezelfde ruimte. Het is alsof je duizenden verschillende gerechten in één grote, rommelige koffer stopt. Als je naar de koffer kijkt, zie je alleen een brij van ingrediënten. Je kunt niet zien welke aardappel bij welke soep hoort.

In de wetenschap noemen ze dit superpositie: de informatie zit verward in elkaar.

2. De oplossing: De SAE (De handige sorteerder)

De auteur gebruikt een Sparse Autoencoder (SAE). Stel je voor dat je die rommelige koffer opent en een super-georganiseerde sorteerder gebruikt. Deze tool haalt de duizenden gerechten uit de brij en legt ze netjes in aparte, duidelijke bakjes.

Bakje 1: "Dit is de bak met alles over celverdeling."
Bakje 2: "Dit is de bak met alles over immuunsystemen."
Bakje 3: "Dit is de bak met DNA-reparatie."

De studie toont aan dat deze AI's ongelooflijk veel van deze bakjes hebben (meer dan 100.000 in totaal!). En het goede nieuws: 99,8% van deze bakjes was voorheen onzichtbaar voor gewone analysemethoden. De AI's hebben dus een enorme, verborgen kennisbank opgebouwd.

3. Wat hebben ze gevonden? (De verrassende resultaten)

Het goede nieuws: Ze weten heel veel!
De AI's hebben de bakjes perfect ingedeeld. Ze weten precies welke genen bij elkaar horen (zoals een team dat samenwerkt). Ze kunnen complexe biologische processen beschrijven, van "celverdeling" tot "mitochondriën". Het is alsof ze een perfecte, georganiseerde encyclopedie van de biologie in hun hoofd hebben.

Het slechte nieuws: Ze begrijpen de "oorzaak" niet.
Dit is het belangrijkste punt van het onderzoek. De auteur deed een test: hij veranderde een specifiek "regelaar-gen" (een Transcription Factor) in de simulatie, net als een experiment in het lab.

De vraag: Reageert de AI op de specifieke genen die door die regelaar worden aangestuurd?
Het antwoord: Nee. De AI merkt wel op dat er iets veranderd is ("Oh, de cel ziet er anders uit!"), maar ze weet niet welke specifieke genen daarvoor verantwoordelijk zijn. Ze reageert op het algemene patroon, niet op de echte regellijn.

Het is alsof je een auto hebt die perfect weet dat er rood licht brandt en dat je moet remmen (het patroon), maar als je vraagt "Waarom moet ik remmen?", zegt hij alleen: "Omdat de auto voor mij ook remt" (het patroon), in plaats van "Omdat er een stoplicht is" (de oorzaak).

4. De conclusie: Een slimme fotograaf, maar geen ingenieur

De studie concludeert dat Geneformer en scGPT briljante fotograaf zijn. Ze kunnen een foto maken van een cel en precies zien welke onderdelen erbij horen. Ze hebben de "statistieken" van het leven perfect geleerd.

Maar ze zijn geen ingenieur. Ze begrijpen niet hoe de machine echt werkt. Ze weten niet wie de knop omdraait en welke schroef losgaat. Ze zien alleen dat als knop A wordt gedrukt, schroef B vaak losgaat, maar ze begrijpen niet dat A de oorzaak is van B.

Waarom is dit belangrijk?

Vroeger dachten we misschien dat deze AI's de heilige graal van de biologie waren en dat we ze konden gebruiken om nieuwe medicijnen te ontwerpen door de "regels" te volgen. Deze studie zegt: Pas op. Ze zijn geweldig om patronen te vinden, maar als je echt wilt begrijpen hoe je een ziekte kunt genezen door in te grijpen op de oorzaak, dan missen deze modellen de essentiële "causale logica".

De auteur heeft al deze "bakjes" (de 100.000+ georganiseerde kennisstukken) online gezet als een interactieve kaart, zodat iedereen kan zien hoe deze AI's de biologie zien. Het is een enorme stap vooruit in het begrijpen van wat deze slimme machines wel en niet kunnen.

Kortom: Deze AI's hebben een gigantisch woordenboek van het leven geleerd, maar ze hebben nog niet de grammatica (de regels van oorzaak en gevolg) onder de knie.

Each language version is independently generated for its own context, not a direct translation.

Probleemstelling

Single-cell foundation models (scFMs) zoals Geneformer en scGPT hebben indrukwekkende prestaties geleverd in taken zoals celtype-annotatie en het voorspellen van perturbatie-responsen. Deze modellen zijn getraind op miljoenen transcriptomische profielen en leren contextuele genrepresentaties zonder expliciete supervisie op regulatorische relaties.

De centrale vraag die dit artikel adresseert, is of deze geleerde representaties causale regulatorische logica bevatten (de gerichte relaties tussen transcriptiefactoren en hun doelgenen) of dat ze slechts statistische co-expressiepatronen weerspiegelen die correleren met, maar niet gelijk zijn aan, regulatie. Eerdere studies op attentieweegs (attention weights) suggereerden dat deze vooral co-expressie vangen, maar de interne structuur van het residu-stroom (residual stream) – waar de meeste informatie door het netwerk stroomt – was nog niet systematisch geanalyseerd. Bovendien wordt aangenomen dat deze modellen last hebben van superpositie: het coderen van meer concepten dan er dimensies zijn, waardoor de informatie voor standaard lineaire methoden (zoals SVD) onzichtbaar wordt.

Methodologie

De auteurs passen voor het eerst Sparse Autoencoders (SAEs) systematisch toe op biologische foundation modellen om superpositie op te lossen en interpreteerbare features te extraheren.

Modellen en Data:
- Geneformer V2-316M: 18 lagen, 1.152 verborgen dimensies, getraind op ~30 miljoen cellen.
- scGPT Whole-Human: 12 lagen, 512 dimensies, getraind op ~33 miljoen cellen.
- Data: Activaties werden geëxtraheerd uit het residu-stroom van alle lagen. Voor Geneformer werden 2.000 K562 controlecellen gebruikt; voor scGPT 3.000 diverse Tabula Sapiens cellen.
SAE Training:
- Er werden TopK SAEs getraind met een 4x overcomplete dictionary (4.608 features voor Geneformer, 2.048 voor scGPT) en een sparsiteitsconstraint van $k=32$ .
- Dit resulteerde in atlases van respectievelijk 82.525 en 24.527 features.
Analyse Pipelines:
- Ontologie Annotatie: Annotatie van top-20 geactiveerde genen per feature tegen vijf databases (GO, KEGG, Reactome, STRING, TRRUST).
- Superpositie Meting: Vergelijking van SAE-features met de top-50 SVD-asen.
- Co-activatie Netwerken: Constructie van grafen op basis van Pointwise Mutual Information (PMI) om modules te identificeren.
- Causale Patching: Het "zeren" van individuele SAE-activaties tijdens de forward pass om te testen of een feature causaal noodzakelijk is voor specifieke uitkomsten.
- Perturbatie Mapping: Testen of features specifiek reageren op CRISPRi-knockdowns van transcriptiefactoren (TFs) en hun bekende doelgenen.
- Multi-tissue Controle: Training van SAEs op een gepoolde dataset (K562 + Tabula Sapiens) om te bepalen of de beperking in het model of in de trainingsdata ligt.

Belangrijkste Bijdragen

Eerste systematische SAE-toepassing op single-cell foundation models, resulterend in interactieve web-atlases voor meer dan 107.000 features.
Kwantificering van Superpositie: Het aantonen dat bijna alle biologische kennis in deze modellen via superpositie is gecodeerd en onzichtbaar is voor lineaire decompositie.
Causale Validatie: Het gebruik van feature-level patching om aan te tonen dat features causaal specifiek zijn, in tegenstelling tot component-level ablaties (zoals attention heads) die eerder geen effect hadden.
Grenzen van Regulatie: Het definitief vaststellen dat deze modellen co-expressie en paden kennen, maar geen causale regulatorische logica.

Resultaten

1. Massale Superpositie en Biologische Organisatie

Superpositie: 99,8% van de SAE-features is "onzichtbaar" voor SVD (ze hebben een lage correlatie met de top-50 SVD-asen).
Biologische Rijkdom: Ondanks dat ze onzichtbaar zijn voor SVD, dragen deze "nieuwe" features 98,7% van alle biologische annotaties.
Annotatiepercentages: 29–59% van de features heeft significante annotaties in biologische databases. Geneformer toont een U-vormig profiel over de lagen: hoge annotatie in vroege lagen (moleculaire machines), een dip in het midden (abstracte berekening), en herstel in late lagen (geïntegreerde programma's).

2. Modulaire Structuur en Informatie-transport

Features organiseren zich in co-activatie modules (141 modules voor Geneformer, 76 voor scGPT).
De thema's verschuiven van moleculaire processen (celcyclus, DNA-replicatie) in vroege lagen naar geïntegreerde cellulaire programma's (differentiatie, signaaltransductie) in latere lagen.
Informatie-Highways: Ondanks dat features laag-specifiek zijn (ze veranderen van laag tot laag), vormen 97–99,8% van de features functionele "informatie-highways" tussen lagen via sterke PMI-verbindingen.

3. Causale Specificiteit vs. Regulatorische Specificiteit

Causale Patching: Het verwijderen van een enkele feature veroorzaakt een specifieke verstoring in de logit-waarden van de geannoteerde genen (mediaan specificiteit 2,36x). Dit bewijst dat de features causaal noodzakelijk zijn voor de berekening.
Perturbatie-Respons (De Kernbevinding): Wanneer het model wordt getest op CRISPRi-perturbaties van 48 transcriptiefactoren:
- Het model detecteert perturbaties (92% van de targets veroorzaakt veranderingen in features).
- Het model mist echter regulatorische specificiteit: slechts 3 van de 48 TFs (6,2%) vertonen een respons waarbij de geactiveerde features specifiek overeenkomen met de bekende regulatorische doelgenen van die TF.
- Het model reageert op de algemene verschuiving in celtoestand (co-expressie), niet op de specifieke regulatorische logica.

4. Controle-experimenten

Een multi-tissue SAE (getraind op K562 + diverse weefsels) leverde slechts een marginale verbetering op (6,2% -> 10,4% specificiteit) en toonde geen systematisch patroon. Dit bevestigt dat de beperking in het model zelf ligt (de representaties van Geneformer/scGPT), niet in de SAE-methode of de trainingsdata.

Significantie en Conclusie

De studie concludeert dat single-cell foundation models georganiseerde biologische kennis hebben geïnternaliseerd (paden, eiwitinteracties, functionele modules, hiërarchische abstractie), maar minimale causale regulatorische logica bevatten.

Implicaties: De huidige trainingsdoelen (zoals next-token prediction of masked gene prediction) leiden inherent tot representaties die sterk zijn in co-expressie, maar zwak in causaliteit. Om echte regulatorische logica te leren, zouden trainingsdoelen nodig zijn die specifiek gericht zijn op het voorspellen van perturbatie-uitkomsten.
Interpretatie: De resultaten tonen aan dat "wat het model weet" (co-expressie) fundamenteel verschilt van "wat het model begrijpt" (causale regulatie).
Hulpmiddelen: De auteurs hebben twee interactieve webplatforms vrijgegeven (Geneformer Feature Atlas en scGPT Feature Atlas) die onderzoekers in staat stellen om deze >107.000 features te verkennen, wat een nieuwe lens biedt voor mechanistische interpretatie van biologische transformer-modellen.

Kortom, hoewel deze modellen krachtige tools zijn voor het begrijpen van celtoestanden en co-expressie-netwerken, zijn ze momenteel geen betrouwbare bron voor het afleiden van causale gen-regulerende netwerken zonder verdere training op perturbatie-gegevens.

Sparse autoencoders reveal organized biological knowledge but minimal regulatory logic in single-cell foundation models: a comparative atlas of Geneformer and scGPT

1. Het probleem: De "Superpositie" (De rommelige koffer)

2. De oplossing: De SAE (De handige sorteerder)

3. Wat hebben ze gevonden? (De verrassende resultaten)

4. De conclusie: Een slimme fotograaf, maar geen ingenieur

Waarom is dit belangrijk?

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Significantie en Conclusie

Meer zoals dit

VeloTree: Inferring single-cell trajectories from RNA velocity fields with varifold distances

Benchmarking Heritability Estimation Strategies Across 86 Configurations and Their Downstream Effect on Polygenic Risk Score Performance

ViraHinter: a dual-modal artificial intelligence framework for predicting virus-host interactions

Temporal structure of the language hierarchy within small cortical patches

Synonymous Codon Usage Bias Overrides Phylogeny to Reflect Convergent Frond Architecture in a Rapidly Radiating Fern Family Thelypteridaceae