Bio-informatica is de fascinerende brug tussen biologie en datawetenschap. In dit veld helpen onderzoekers computers om enorme hoeveelheden biologische informatie te ontcijferen, van het decoderen van ons DNA tot het begrijpen hoe virussen muteren. Het is de motor achter veel moderne doorbraken in de gezondheidszorg en de ecologie, waarbij complexe patronen in levende systemen worden vertaald naar bruikbare inzichten.

Op Gist.Science maken we de nieuwste ontdekkingen in dit vakgebied toegankelijk voor iedereen. Wij verwerken elke nieuwe preprint die wordt gepubliceerd op bioRxiv, de belangrijkste bron voor nog niet-peer-reviewed onderzoek in de levenswetenschappen. Voor elk document bieden we zowel een duidelijke, alledaagse uitleg als een gedetailleerde technische samenvatting, zodat u snel de kern begrijpt zonder vast te lopen in jargon.

Hieronder vindt u de meest recente bijdragen uit de wereld van bio-informatica, zorgvuldig samengevat voor u.

Structure-aware geometric graph learning for modeling protease-substrate specificity at scale

OmniCleave is een schaalbaar, structuurbewust geometrisch grafiekleringskader dat de specificiteit van protease-substraten nauwkeuriger modelleert door ruimtelijke context en hogere-orde relaties te integreren, waardoor het bestaande methoden overtreft en nieuwe biologische inzichten biedt.

Guo, X., Bi, Y., Ran, Z., Pan, T., Sun, H., Hao, Y., Jia, R., Wang, C., Zhang, Q., Kurgan, L., Song, J., Li, F.2026-04-10💻 bioinformatics

A computational model for quantifying instability of tandem repeats across the genome

Deze studie introduceert een algemeen computergestuurd model dat, met behulp van long-read sequencing-data, de somatische instabiliteit van tandemherhalingen over het hele genoom kwantificeert en aantoont dat de variatie in instabiliteit sterker wordt bepaald door de samenstelling dan door de totale lengte van de herhalingen.

Dolzhenko, E., English, A., Mokveld, T., de Sena Brandine, G., Kronenberg, Z., Wright, G., Drogemoller, B., Rowell, W. J., Wenger, A. M., Bennett, M. F., Weisburd, B., Erwin, G. S., Jin, P., Nelson, D (…)2026-04-10💻 bioinformatics

Statistical Principles Define an Open-Source Differential Analysis Workflow for Mass Spectrometry Imaging Experiments with Complex Designs

Dit artikel presenteert een open-source, op statistische principes gebaseerde werkstroom voor het analyseren van complexe massaspectrometrie-imaging-experimenten, waarbij de impact van signaalverwerking, selectie van gebieden van belang en statistische modellering op de detectie van differentieel abundantie wordt geïllustreerd aan de hand van een casestudie en gesimuleerde datasets.

Rogers, E. B. T., Lakkimsetty, S. S., Bemis, K. A., Schurman, C. A., Angel, P. A., Schilling, B., Vitek, O.2026-04-10💻 bioinformatics

TopicVI: A Knowledge-guided deep interpretable model for resolving context-specific gene programs

Dit paper introduceert TopicVI, een diep interpreteerbaar model dat gevestigde biologische kennis combineert met datagedreven verfijning via optimaal transport om contextspecifieke genprogramma's in single-cell en ruimtelijke transcriptomics-data te ontrafelen, wat leidt tot verbeterde celclustering, batchcorrectie en inzichten in complexe ziekteprocessen zoals glioblastoom.

Cai, G., Zhao, W., Zhu, X., Lin, Y., Zhou, B., Cao, J., He, Q., Yang, B., Gu, X., Xiong, X., Zhou, Z.2026-04-10💻 bioinformatics

DIANA: Deep Learning Identification and Assessment of Ancient DNA

Dit artikel introduceert DIANA, een deep learning-model dat nauwkeurig en robuust metadata zoals gastheer, gemeenschapssoort en materiaal van oude DNA-monsters voorspelt op basis van unitig-abundanties, waarbij het bovendien in staat is tot semantische generalisatie om onbekende labels aan hun overkoepelende categorieën te koppelen.

Duitama Gonzalez, C., Lopopolo, M., Nishimura, L., Faure, R., Duchene, S.2026-04-10💻 bioinformatics

CoPhaser: generic modeling of biological cycles in scRNA-seq with context-dependent periodic manifolds

CoPhaser is een nieuw algoritme dat variatie in scRNA-seq-gegevens ontleedt door contextafhankelijke periodieke manifolds te modelleren, waardoor het mogelijk wordt om biologische cycli zoals de celcyclus en circadiane ritmes nauwkeurig te reconstrueren en te koppelen aan celfuncties en ziekteprocessen zonder voorafgaande kennis van genprogramma's.

Paychere, Y., Salati, A., Gobet, C., Naef, F.2026-04-09💻 bioinformatics