La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

ARCH3D: A foundation model for global genome architecture

Ce papier présente ARCH3D, un modèle fondation innovant pour l'architecture génomique globale qui, grâce à une tâche de modélisation masquée des loci intégrant des profils de contact à l'échelle du génome, capture la structure spatiale globale et permet de reconstruire les interactions interchromosomiques et multivues, ouvrant ainsi la voie à la création d'un « génome virtuel » capable de simuler le comportement et la dynamique du génome.

Galioto, N., Stansbury, C., Gorodetsky, A. A., Rajapakse, I.2026-02-25💻 bioinformatics

RNA foundation models enable generalizable endometriosis disease classification and stable gene-level interpretation

Cette étude démontre que les modèles de base en ARN, combinés à une nouvelle méthode d'interprétabilité (CA-IG), améliorent significativement la classification généralisable de l'endométriose et permettent une identification stable de gènes prédictifs biologiquement pertinents, surmontant ainsi les limites de généralisation des modèles d'apprentissage automatique traditionnels.

McConnell, N., Kelly, J., Tadikonda, R., Bettencourt-Silva, J., Mulligan, N., Madgwick, M., Krishna, R., Strudwick, J., Evans, A., Checkley, S., Carrieri, A. P., Smyrnakis, M., Knowles, C. H., Gardine (…)2026-02-25💻 bioinformatics

Longitudinal modality prediction learns gene regulatory patterns: insights from a single-cell competition

En organisant la plus grande compétition de données single-cell à ce jour sur un jeu de données longitudinal multimodal, cette étude a permis d'identifier des stratégies de modélisation supérieures pour prédire les régulations géniques entre différentes modalités moléculaires et d'établir une nouvelle norme pour le développement de méthodes futures.

Lance, C., Shitov, V. A., Wen, H., Ji, Y., Holderrieth, P., Wu, Y., Liu, R., Cannoodt, R., Tang, W., Waldrant, K., DeMeo, B., Cortes, M., Kotlarz, D., Tang, J., Xie, Y., Theis, F. J., Burkhardt, D. B. (…)2026-02-25💻 bioinformatics

TopoMetry systematically learns and evaluates the latent geometry of single-cell data

Le cadre TopoMetry introduit une méthode unifiée pour apprendre et évaluer systématiquement la géométrie latente des données de cellules uniques, surpassant les approches standards en préservant fidèlement la structure biologique et en facilitant l'exploration de la diversité cellulaire via un rapport généré en une seule ligne de code.

Oliveira, D. S., Domingos, A. I., Velloso, L. A.2026-02-24💻 bioinformatics

Machine learning-based rescoring with MS2Rescore boosts peptide identification and taxonomic specificity in metaproteomics

Cette étude démontre que l'outil de rescoring basé sur l'apprentissage automatique MS2Rescore améliore considérablement le taux d'identification des peptides et la spécificité taxonomique en métagénomique, permettant ainsi une analyse taxonomique plus fiable avec un taux de découverte fausse réduit à 0,1 %.

Malliet, X., Declercq, A., Gabriels, R., Holstein, T., Mesuere, B., Muth, T., Verschaffelt, P., Martens, L., Van Den Bossche, T.2026-02-24💻 bioinformatics

CoMR: an integrative scoring pipeline for Comprehensive Mitochondrial proteome Reconstruction across eukaryotes

Le pipeline CoMR améliore la reconstruction du protéome mitochondrial chez les eucaryotes en intégrant des prédictions de signaux de ciblage, des recherches d'homologie et des analyses phylogénétiques dans un cadre de notation unifié, surpassant ainsi les méthodes de prédiction isolées tant chez les organismes modèles que chez les lignées divergentes.

Boisard, J., Williams, S. K., Roger, A. J., Stairs, C. W.2026-02-24💻 bioinformatics