La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Horse, not zebra: accounting for lineage abundance in maximum likelihood phylogenetics

Cet article présente deux nouvelles approches intégrées dans le logiciel MAPLE qui améliorent considérablement la précision de l'inférence phylogénétique en maximum de vraisemblance en priorisant le placement des séquences sur des lignées abondantes plutôt que rares, un principe illustré par l'analogie « penser cheval, pas zèbre », particulièrement efficace pour les données épidémiologiques à grande échelle comme celles du SARS-CoV-2.

De Maio, N.2026-03-27💻 bioinformatics

Adding layers of information to scRNA-seq data using pre-trained language models

Les auteurs proposent une méthode pour enrichir les analyses de données scRNA-seq en entraînant conjointement des modèles de langage sur ces données quantitatives et la littérature biomédicale, afin d'obtenir des représentations interprétables et généralisables intégrant des connaissances externes.

Krissmer, S. M., Menger, J., Rollin, J., Vogel, T. M., Binder, H., Hackenberg, M.2026-03-26💻 bioinformatics

Seqwin: Ultrafast identification of signature sequences in microbial genomes

Le papier présente Seqwin, un cadre open-source capable d'identifier rapidement et précisément des séquences signatures microbiennes dans de vastes collections de génomes en construisant des graphes de minimiseurs de pan-génome pondérés, surpassant ainsi les méthodes existantes en termes de précision et d'efficacité computationnelle.

Wang, M. X., Kille, B., Nute, M. G., Zhou, S., Stadler, L. B., Treangen, T. J.2026-03-26💻 bioinformatics

Amaranth: Enhanced Single-Cell Transcript Assembly via Discriminative Modeling of UMI Reads and Internal Reads

Le papier présente Amaranth, un nouvel assembleur de transcriptome à l'échelle cellulaire qui améliore la reconstruction des isoformes en exploitant une modélisation discriminative des différences statistiques entre les lectures UMI et les lectures internes, surpassant ainsi les méthodes existantes sur des données Smart-seq3.

Zang, X. C., Zahin, T., Khan, I. M., Shi, Q., Xing, Y., Shao, M.2026-03-26💻 bioinformatics

Predicting Unseen Gene Perturbation Response Using Graph Neural Networks with Biological Priors

Ce papier présente PerturbGraph, un cadre d'apprentissage par graphes enrichi par des connaissances biologiques qui prédit avec précision les réponses transcriptionnelles à des perturbations génétiques non observées en intégrant des réseaux d'interactions moléculaires et des annotations fonctionnelles, surpassant ainsi les méthodes d'apprentissage automatique classiques et les approches profondes existantes.

Dip, S. A., Zhang, L.2026-03-26💻 bioinformatics

Nextstrain automates real-time phylodynamic analysis of open data for endemic and emerging pathogens

Le papier présente Nextstrain, une plateforme automatisée qui fournit une surveillance génomique en temps réel et des analyses phylodynamiques pour 21 virus et la bactérie *Mycobacterium tuberculosis* en exploitant des données de séquence ouvertes.

Andrews, K. R., Chang, J., Roemer, C., Hadfield, J., Lin, V., Brito, A. F., Daodu, R., Joia, I. A., Kistler, K., Li, A. W., Moncla, L. H., Paredes, M. I., Kuhnert, D., Torres, L. M., Voitl, L., Aksame (…)2026-03-26💻 bioinformatics

Experimental mismatch in benchmarking PELSA and LiP-MS

Cette étude remet en question la conclusion de Li et al. selon laquelle la méthode PELSA surpasserait LiP-MS en sensibilité, en démontrant que la différence de 21 fois observée pour FKBP1A résulte de conditions expérimentales non appariées et d'une imputation de données non divulguée, invitant ainsi à la prudence quant aux affirmations de supériorité quantitative.

Van Leene, C., Araftpoor, E., Gevaert, K.2026-03-26💻 bioinformatics

FoundedPBI: Using Genomic Foundation Models to predict Phage-Bacterium Interactions

Le papier présente FoundedPBI, une approche d'apprentissage profond ensembliste qui exploite des modèles de fondation génomiques et des stratégies d'agrégation de contexte long pour prédire avec une précision inédite les interactions entre phages et bactéries à partir de leurs séquences d'ADN, surmontant ainsi les limites des criblages expérimentaux traditionnels.

Carrillo Barrera, P., Babey, A., Pena, C. A.2026-03-26💻 bioinformatics

GraphHDBSCAN*: Graph-based Hierarchical Clustering on High Dimensional Single-cell RNA Sequencing Data

Ce papier présente GraphHDBSCAN*, une méthode de clustering hiérarchique basée sur les graphes et sans hyperparamètres qui améliore l'identification des populations cellulaires et de leur organisation hiérarchique dans les données de séquençage de l'ARN monocellulaire.

Ghoreishi, S. A., Szmigiel, A. W., Nagai, J. S., Gesteira Costa Filho, I., Zimek, A., Campello, R. J. G. B.2026-03-26💻 bioinformatics