La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie est un outil curé et convivial qui utilise des modèles de Markov cachés à profil personnalisé pour atteindre une sensibilité nettement supérieure à celle des bases de données existantes dans la détection de gènes spécifiques aux substrats impliqués dans la dégradation aérobie et anaérobie des BTEX, tout en fournissant des visualisations intégrées des voies métaboliques et du génome pour les études génomiques environnementales et comparatives.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

Cette étude révèle que TDP-43 régule la transcription des gènes et facilite les bouclages de la chromatine à longue distance en se liant et en stabilisant les structures G-quadruplex de l'ADN aux ancres des boucles de chromatine, fournissant ainsi une explication mécanistique de la dysrégulation génique dans les maladies associées à un dysfonctionnement de TDP-43.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

Deep Learning for Cross-Domain Spatial Transcriptomic Modeling of Tissue Repair

Cette étude présente un cadre d'apprentissage profond interdomaine qui exploite une analyse latente basée sur la récurrence et des métriques de fragmentation pathologique pour caractériser et comparer l'organisation spatiale et les dynamiques de remodelage de la réparation tissulaire par rapport aux microenvironnements tumoraux à travers des ensembles de données humains hétérogènes.

Pham, T. D.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

Ce papier présente un cadre bayésien modulaire, illustré par le logiciel Plasmotrack pour *Plasmodium falciparum*, qui reconstruit des réseaux de transmission dirigés à partir d'infections polyclonales en intégrant plusieurs sources génétiques et des parents non observés afin d'estimer des indicateurs clés de santé publique.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

Cet article présente des protocoles informatiques et des exemples pratiques pour automatiser l'annotation des ARN non codants viraux et récupérer programmatiquement les données de Rfam via son API RESTful, tout en exploitant R2DT pour générer des visualisations complètes de structures 2D en vue de leur intégration dans des flux de travail de bioinformatique et d'apprentissage automatique.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

L'article présente PXN, un cadre d'apprentissage automatique probabiliste qui surmonte l'incompatibilité interplateforme des données publiques d'expression génique en traduisant de manière transparente des ensembles de données divers (y compris en faisant le pont entre les technologies de microarray et de RNA-seq) vers une représentation unifiée, améliorant ainsi considérablement la précision et la puissance statistique des analyses biologiques intégratives à grande échelle.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

Les auteurs ont développé TriCyP, un outil basé sur un modèle de langage protéique qui prédit avec précision les états fonctionnels des cystéines (liaisons disulfure, coordination métallique et thiols libres) à partir de structures prédites, permettant un catalogue à l'échelle du protéome de 2,7 millions de cystéines à travers les domaines ECOD qui révèle des motifs biologiques distincts et identifie de nouvelles familles de liaison aux métaux et des interactions potentielles entre protéines.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

L'article présente Aiki-Sol, un prédicteur de solubilité des protéines qui surmonte le plateau de performance des modèles existants en traitant explicitement les régimes de centrifugation comme une caractéristique critique plutôt que comme du bruit, réalisant ainsi des gains significatifs de précision sur un nouvel ensemble de données annoté selon la rigueur pour E. coli.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

Ce papier présente un cadre spécifique au contexte qui valide des ensembles de gènes de réponse au stress en exploitant des réseaux d'interactions protéine-protéine restreints aux gènes différentiellement exprimés, démontrant que des gènes « Réponse Principale » biologiquement soutenus forment des sous-réseaux significativement interconnectés à travers les conditions de température.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics