Bio-informatica is de fascinerende brug tussen biologie en datawetenschap. In dit veld helpen onderzoekers computers om enorme hoeveelheden biologische informatie te ontcijferen, van het decoderen van ons DNA tot het begrijpen hoe virussen muteren. Het is de motor achter veel moderne doorbraken in de gezondheidszorg en de ecologie, waarbij complexe patronen in levende systemen worden vertaald naar bruikbare inzichten.

Op Gist.Science maken we de nieuwste ontdekkingen in dit vakgebied toegankelijk voor iedereen. Wij verwerken elke nieuwe preprint die wordt gepubliceerd op bioRxiv, de belangrijkste bron voor nog niet-peer-reviewed onderzoek in de levenswetenschappen. Voor elk document bieden we zowel een duidelijke, alledaagse uitleg als een gedetailleerde technische samenvatting, zodat u snel de kern begrijpt zonder vast te lopen in jargon.

Hieronder vindt u de meest recente bijdragen uit de wereld van bio-informatica, zorgvuldig samengevat voor u.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie is een curatie-gedreven, gebruiksvriendelijke tool die aangepaste profiel-verborgen Markov-modellen toepast om een aanzienlijk hogere sensitiviteit dan bestaande databases te bereiken bij het detecteren van substraat-specifieke genen die betrokken zijn bij aerobe en anaerobe BTEX-degradatie, terwijl het tevens geïntegreerde pathway- en genomische visualisaties biedt voor ecologische en vergelijkende genomische studies.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

Deze studie toont aan dat TDP-43 de genexpressie reguleert en langeafstands-chromatinlussen faciliteert door te binden aan en DNA G-quadruplexstructuren te stabiliseren op chromatinlusankers, waardoor een mechanistische verklaring wordt geboden voor genregulatiestoornissen bij ziekten die geassocieerd zijn met TDP-43-dysfunctie.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

Dit artikel introduceert een modulaire Bayesiaanse raamwerk, geïllustreerd door de Plasmotrack-software voor *Plasmodium falciparum*, dat gerichte transmissienetwerken reconstrueert uit polyklonale infecties door rekening te houden met meerdere genetische bronnen en niet-geobserveerde ouders om belangrijke volksgezondheidsmetrieken te schatten.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

Dit artikel presenteert computationele protocollen en praktische voorbeelden voor het automatiseren van de annotatie van virale niet-coderende RNA's en het programmeren van het ophalen van Rfam-data via de RESTful API, terwijl R2DT wordt ingezet om uitgebreide 2D-structuurvisualisaties te genereren voor integratie in bioinformatica- en machine learning-workflows.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

Het artikel introduceert PXN, een probabilistisch machine learning-framework dat platformoverschrijdende incompatibiliteit in publieke genexpressiedata overwint door diverse datasets (waaronder de overbrugging van microarray- en RNA-seq-technologieën) naadloos te vertalen naar een verenigde representatie, waardoor de nauwkeurigheid en statistische kracht van grootschalige integratieve biologische analyses aanzienlijk worden versterkt.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

De auteurs ontwikkelden TriCyP, een op taalmodellen voor eiwitten gebaseerde tool die functionele toestanden van cysteïne (disulfidebindingen, metaalcoördinatie en vrije thiolen) nauwkeurig voorspelt op basis van voorspelde structuren, waardoor een catalogus op proteoomschaal van 2,7 miljoen cysteïnes over ECOD-domeinen mogelijk wordt die duidelijke biologische patronen blootlegt en nieuwe metaalbindende families en potentiële eiwit-eiwitinteracties identificeert.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

Het artikel introduceert Aiki-Sol, een voorspeller voor eiwitsolubiliteit die de prestatieplateau's van bestaande modellen doorbreekt door centrifugeringsregimes expliciet te behandelen als een kritieke eigenschap in plaats van ruis, waardoor aanzienlijke nauwkeurigheidsverbeteringen worden bereikt op een nieuw vrijgegeven, op strengheid geannoteerde E. coli-dataset.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

Dit artikel presenteert een contextspecifiek raamwerk dat stressrespons-geengroepen valideert door gebruik te maken van eiwit-eiwitinteractienetwerken die beperkt zijn tot differentieel tot expressie gebrachte genen, en toont aan dat biologisch onderbouwde "Primaire Respons"-genen significant onderling verbonden subnetwerken vormen over temperatuurcondities heen.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics