anndataR improves interoperability between R and Python in single-cell transcriptomics

Het artikel introduceert anndataR, een R-pakket dat de interoperabiliteit tussen R en Python in single-cell transcriptomics verbetert door het naadloze lezen, schrijven en converteren van H5AD-bestanden naar SingleCellExperiment- of Seurat-objecten mogelijk te maken.

Oorspronkelijke auteurs: Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.

Gepubliceerd 2026-03-08
📖 4 min leestijd☕ Koffiepauze-leesvoer
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat de wereld van de wetenschap, en dan specifiek het bestuderen van individuele cellen (single-cell transcriptomics), is opgedeeld in twee grote landen: R-land en Python-land.

Beide landen hebben hun eigen taal, hun eigen wegen en hun eigen manier van opslaan.

  • In Python-land gebruiken ze een soort "H5AD-magazijn" (een bestandstype) om al hun data op te slaan. Dit is heel populair en wordt door veel onderzoekers gebruikt.
  • In R-land hebben ze hun eigen "SingleCellExperiment" en "Seurat" dozen.

Het probleem? Als een onderzoeker in R-land werkt, maar een collega in Python-land stuurt hem een H5AD-bestand, kan hij dat niet zomaar openen. Het is alsof je een sleutel uit het ene land probeert te gebruiken in een slot van het andere land. Je moet eerst een tussenstap maken, vaak met ingewikkelde brugconstructies (zoals "FFI" of virtuele machines), wat traag is, veel geheugen kost en soms kapot gaat.

Hier komt anndataR om de hoek kijken.

Wat is anndataR eigenlijk?

Je kunt anndataR zien als een super-vertaler en een universele sleutel.

  1. Het is een native sleutel: In plaats van een ingewikkelde brug te bouwen om Python-land te bezoeken, heeft anndataR een sleutel die direct in het H5AD-slot past. R-gebruikers kunnen nu H5AD-bestanden direct openen, lezen en zelfs schrijven, zonder dat ze ooit Python hoeven te installeren of te gebruiken.
  2. Het is een transformatiemachine: Het kan die H5AD-data niet alleen lezen, maar ook direct omtoveren naar de vertrouwde "dozen" van R (SingleCellExperiment of Seurat). En andersom ook: R-data kan het omtoveren naar een H5AD-bestand dat Python-gebruikers weer kunnen gebruiken.
  3. Het is een eigen huis: Het pakket maakt zelfs een eigen versie van het H5AD-object binnen R. Dit betekent dat je de data kunt bekijken en bewerken alsof het een normaal R-object is, zonder de "Python-geest" erbij te halen.

Waarom is dit zo'n groot nieuws? (De analogie van de bouw)

Stel je voor dat je een huis wilt bouwen.

  • Vroeger: Als je een plan van de buren (Python) kreeg, moest je eerst een heleboel mensen inhuren die zowel Nederlands als Frans spreken (de "FFI" of vertalers). Die mensen moesten het plan vertalen, maar ze maakten vaak fouten, het duurde lang en ze hadden een enorme tafel nodig om alles neer te leggen (veel geheugen).
  • Nu met anndataR: Je hebt nu een architect die direct het plan van de buren kan lezen en begrijpen. Hij kan het plan direct in jouw eigen bouwstijl overzetten, zonder tussenpersoon. Het is sneller, veiliger en je hoeft geen extra personeel in te huren.

Hoe werkt het in de praktijk?

De auteurs van het artikel (een team van experts uit beide landen) hebben dit pakket gebouwd door samen te werken. Ze hebben niet alleen de vertaling gemaakt, maar ook streng getest.

Stel je voor dat ze een "round-trip" test doen:

  1. Ze nemen een H5AD-bestand.
  2. Zetten het om naar R.
  3. Zetten het terug naar Python.
  4. Kijken of het er nog precies hetzelfde uitziet.

Als er zelfs maar één klein verschil is (bijvoorbeeld een komma die verplaatst is), weten ze dat het niet werkt. Ze hebben dit duizenden keren gedaan om te garanderen dat de data nooit beschadigd raakt.

Wat levert het op?

  • Snelheid: Het is veel sneller dan de oude methodes.
  • Geheugen: Het kost minder RAM-geheugen, wat cruciaal is als je met enorme datasets werkt (zoals miljoenen cellen).
  • Vrijheid: Onderzoekers hoeven niet meer vast te zitten aan één taal. Ze kunnen de beste tools van Python gebruiken voor het ene deel van hun onderzoek en de beste statistische tools van R voor het andere deel, zonder gedoe.

Kortom: anndataR breekt de muur tussen R en Python in de celbiologie. Het zorgt ervoor dat data vrij kan stromen, zodat wetenschappers zich kunnen focussen op het ontdekken van nieuwe geneesmiddelen en ziektemechanismen, in plaats van worstelen met bestandsformaten.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →