Bio-informatica is de fascinerende brug tussen biologie en datawetenschap. In dit veld helpen onderzoekers computers om enorme hoeveelheden biologische informatie te ontcijferen, van het decoderen van ons DNA tot het begrijpen hoe virussen muteren. Het is de motor achter veel moderne doorbraken in de gezondheidszorg en de ecologie, waarbij complexe patronen in levende systemen worden vertaald naar bruikbare inzichten.

Op Gist.Science maken we de nieuwste ontdekkingen in dit vakgebied toegankelijk voor iedereen. Wij verwerken elke nieuwe preprint die wordt gepubliceerd op bioRxiv, de belangrijkste bron voor nog niet-peer-reviewed onderzoek in de levenswetenschappen. Voor elk document bieden we zowel een duidelijke, alledaagse uitleg als een gedetailleerde technische samenvatting, zodat u snel de kern begrijpt zonder vast te lopen in jargon.

Hieronder vindt u de meest recente bijdragen uit de wereld van bio-informatica, zorgvuldig samengevat voor u.

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

Dit artikel presenteert een benchmarkstudie waarbij 80 fenotypes uit de openSNP-dataset worden geanalyseerd met diverse machine learning-, deep learning- en polygenic risk score-methoden, waarbij wordt geconcludeerd dat machine learning voor 44 fenotypes beter presteert dan traditionele polygenic risk score-tools, die op hun beurt voor 36 fenotypes superieur zijn.

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics

MapMyCells: High-performance mapping of unlabeled cell-by-gene data to reference brain taxonomies

MapMyCells is een open-source framework dat unlabeled single-cell datasets efficiënt en reproduceerbaar mapt naar hiërarchische referentie-taxonomieën voor hersencellen, waardoor cross-study integratie en annotatie mogelijk wordt zonder speciale hardware.

Daniel, S. F., Lee, C., Mollenkopf, T., Lee, M., Arbuckle, J., Fiabane, E., Gabitto, M. I., Johansen, N., Kapen, I., Kraft, A. W., Lai, J., Li, S. Y., McGinty, R., Miller, J. A., Welch-Moosman, S., Ot (…)2026-03-09💻 bioinformatics

anndataR improves interoperability between R and Python in single-cell transcriptomics

Het artikel introduceert anndataR, een R-pakket dat de interoperabiliteit tussen R en Python in single-cell transcriptomics verbetert door het naadloze lezen, schrijven en converteren van H5AD-bestanden naar SingleCellExperiment- of Seurat-objecten mogelijk te maken.

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

Deze studie introduceert een verbeterde en gestandaardiseerde dataset met bijna het dubbele aantal gecureerde gastheer-virusrecords om machine learning-modellen te evalueren voor het voorspellen van virale infecties bij zoogdieren en primaten, waarbij wordt aangetoond dat voorspellende prestaties aanzienlijk verbeteren bij bredere taxonomische rangen en bij het verminderen van de fylogenetische afstand tussen trainings- en testdata, maar dat modellen faalrijke prestaties leveren bij het voorspellen van volledig nieuwe virusfamilies.

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

MiRformer is een unificerend generatief framework dat op basis van dubbele transformer-architectuur en een schuifvenster-attentie-mechanisme niet alleen nauwkeurige voorspellingen doet voor miRNA-mRNA-interacties en bindingsplaatsen in lange mRNA-sequenties, maar ook biologisch plausibele, mRNA-geconditioneerde miRNA-sequenties synthetiseert.

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

Dit artikel introduceert de Stochastic System Identification Toolkit (SSIT), een open-source MATLAB-softwarepakket dat geavanceerde stochastische modellering, parameterfiting, sensitiviteitsanalyse en experimentontwerp mogelijk maakt om biologische data met variabiliteit nauwkeurig te analyseren en te voorspellen.

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

MS-BCR-DB: an integrated BCR repertoire database to mine humoral multiple sclerosis signatures

De auteurs hebben de MS-BCR-Database ontwikkeld, een uniek, publiek toegankelijk en gestandaardiseerd bestand met BCR-sequencing-data van multiple sclerosis-patiënten dat inzicht biedt in ziekte-geassocieerde B-celrepertoires, inclusief convergente clonotypen en reacties tegen zowel virale antigenen en zelf-eiwitten.

Ballerini, C., Cardente, N., Abbate, M. F., Le Quy, K., Rincon, N., Wolfram, L., Lossius, A., Portaccio, E., Amato, M. P., Ballerini, C., Greiff, V.2026-03-08💻 bioinformatics