La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Horse, not zebra: accounting for lineage abundance in maximum likelihood phylogenetics

Cet article présente deux nouvelles approches intégrées dans le logiciel MAPLE qui améliorent considérablement la précision de l'inférence phylogénétique en maximum de vraisemblance en priorisant le placement des séquences sur des lignées abondantes plutôt que rares, un principe illustré par l'analogie « penser cheval, pas zèbre », particulièrement efficace pour les données épidémiologiques à grande échelle comme celles du SARS-CoV-2.

De Maio, N.2026-03-27💻 bioinformatics

Amaranth: Enhanced Single-Cell Transcript Assembly via Discriminative Modeling of UMI Reads and Internal Reads

Le papier présente Amaranth, un nouvel assembleur de transcriptome à l'échelle cellulaire qui améliore la reconstruction des isoformes en exploitant une modélisation discriminative des différences statistiques entre les lectures UMI et les lectures internes, surpassant ainsi les méthodes existantes sur des données Smart-seq3.

Zang, X. C., Zahin, T., Khan, I. M., Shi, Q., Xing, Y., Shao, M.2026-03-26💻 bioinformatics

Predicting Unseen Gene Perturbation Response Using Graph Neural Networks with Biological Priors

Ce papier présente PerturbGraph, un cadre d'apprentissage par graphes enrichi par des connaissances biologiques qui prédit avec précision les réponses transcriptionnelles à des perturbations génétiques non observées en intégrant des réseaux d'interactions moléculaires et des annotations fonctionnelles, surpassant ainsi les méthodes d'apprentissage automatique classiques et les approches profondes existantes.

Dip, S. A., Zhang, L.2026-03-26💻 bioinformatics

Nextstrain automates real-time phylodynamic analysis of open data for endemic and emerging pathogens

Le papier présente Nextstrain, une plateforme automatisée qui fournit une surveillance génomique en temps réel et des analyses phylodynamiques pour 21 virus et la bactérie *Mycobacterium tuberculosis* en exploitant des données de séquence ouvertes.

Andrews, K. R., Chang, J., Roemer, C., Hadfield, J., Lin, V., Brito, A. F., Daodu, R., Joia, I. A., Kistler, K., Li, A. W., Moncla, L. H., Paredes, M. I., Kuhnert, D., Torres, L. M., Voitl, L., Aksame (…)2026-03-26💻 bioinformatics

FoundedPBI: Using Genomic Foundation Models to predict Phage-Bacterium Interactions

Le papier présente FoundedPBI, une approche d'apprentissage profond ensembliste qui exploite des modèles de fondation génomiques et des stratégies d'agrégation de contexte long pour prédire avec une précision inédite les interactions entre phages et bactéries à partir de leurs séquences d'ADN, surmontant ainsi les limites des criblages expérimentaux traditionnels.

Carrillo Barrera, P., Babey, A., Pena, C. A.2026-03-26💻 bioinformatics

Is metabolism spatially optimized? Structural modeling of consecutive enzyme pairs reveals no evidence for spatial optimization of catalytic site proximity.

Cette étude, utilisant des modèles de structure protéique avancés pour analyser des paires d'enzymes consécutives chez *E. coli*, conclut qu'aucune preuve ne démontre que les sites catalytiques des enzymes interagissantes sont spatialement optimisés pour faciliter le transfert de métabolites.

Algorta, J., Walther, D.2026-03-26💻 bioinformatics

Self-supervised learning for a gene program-centric view of cell states

Le modèle d'apprentissage auto-supervisé Tripso propose une approche centrée sur les programmes géniques pour décoder les états cellulaires à partir de données omiques à haut débit, permettant ainsi de révéler des dynamiques biologiques spécifiques à l'âge, d'identifier de nouveaux programmes géniques et de générer des hypothèses thérapeutiques validables.

Moullet, M., Isobe, T., Vahidi, A., Leonardi, C., Paulas-Condori, L., Soelistyo, C., Steele, L., Ly, K. C. H., Quiroga Londono, M., Mende, N., Stephenson, E., Iskander, D., Webb, S., Goh, I., Vijayaba (…)2026-03-26💻 bioinformatics

Signature Distance: Generalizing Energy Statistics

Cet article présente la Signature Distance, une métrique généralisant la distance d'énergie pour comparer des distributions empiriques en capturant les changements de densité et de structure topologique, ce qui la rend supérieure pour l'évaluation de modèles génératifs et l'expansion de données biologiques.

Lazzaro, N., Marchesi, R., Leonardi, G., Tessadori, J., Chierici, M., Sales, G., Moroni, M., Tebaldi, T., Jurman, G.2026-03-25💻 bioinformatics

Chromatix: a differentiable, GPU-accelerated wave-optics library

Le papier présente Chromatix, une bibliothèque open-source accélérée par GPU et différentiable basée sur JAX, qui standardise les simulations d'optique ondulatoire pour démocratiser la conception de systèmes optiques et améliorer les performances dans des domaines tels que la microscopie et l'holographie.

Deb, D., Both, G.-J., Bezzam, E., Kohli, A., Yang, S., Chaware, A., Allier, C., Cai, C., Anderberg, G., Eybposh, M. H., Schneider, M. C., Heintzmann, R., Rivera-Sanchez, F. A., Simmerer, C., Meng, G. (…)2026-03-25💻 bioinformatics