La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

DeepTrio: Variant Calling in Families Using Deep Learning

DeepTrio est un modèle d'apprentissage profond qui améliore la précision du décodage des variants génétiques dans les trios familiaux (enfant, mère, père) en apprenant directement à partir des données de séquençage, surpassant ainsi les performances de DeepVariant sur les données Illumina et PacBio HiFi, y compris à des couvertures plus faibles.

Brambrink, L., Kolesnikov, A., Goel, S., Nattestad, M., Yun, T., Baid, G., Yang, H., McLean, C., Shafin, K., Chang, P.-C., Carroll, A.2026-04-02💻 bioinformatics

Optimisation of Weighted Ensembles of Genomic Prediction Models in Maize

Cette étude évalue l'optimisation des poids dans les ensembles de modèles de prédiction génomique du maïs via trois approches, démontrant que l'ajustement des poids améliore la performance prédictive par rapport à une moyenne naïve, bien qu'aucune méthode d'optimisation ne se soit révélée systématiquement supérieure aux autres.

Tomura, S., Powell, O. M., Wilkinson, M. J., Lefevre, J., Cooper, M.2026-04-02💻 bioinformatics

Towards a Cytometry Foundation Model: Interpretable Sample-level Predictive Modelling via Pretrained Transformers

Ce papier présente le GPCT, un modèle de transformateur préentraîné et interprétable qui surmonte les limitations liées à la variabilité des marqueurs en flow cytométrie, permettant une modélisation prédictive robuste au niveau des échantillons et la validation biologique des sous-populations cellulaires déterminantes.

Zhuang, Z., Mashford, B. S., Zheng, L., Andrews, T. D.2026-04-02💻 bioinformatics

DESPOT: Direction-Enhanced Scoring POTentials

Le papier présente DESPOT, un cadre de potentiels de connaissances anisotropes qui améliore considérablement le score des poses et le criblage virtuel en modélisant les préférences directionnelles des interactions protéine-ligand via une formulation probabiliste inversée, surpassant ainsi les méthodes isotropes traditionnelles.

Poelmans, R., Bruncsics, B., Arany, A., Van Eynde, W., Shemy, A., Moreau, Y., Voet, A. R.2026-04-02💻 bioinformatics

When Multimodal Fusion Fails: Contrastive Alignment as a Necessary Stabilizer for TCR--Peptide Binding Prediction

L'article présente TRACE, un cadre multimodal qui utilise l'alignement contrastif pour stabiliser la prédiction de liaison TCR-peptide en intégrant des données structurelles imparfaites sans compromettre la performance, démontrant ainsi que la manière dont les modalités interagissent est cruciale pour la robustesse en bioinformatique.

Qi, C., Wang, W., Fang, H., Wei, Z.2026-04-02💻 bioinformatics

EMITS: expectation-maximization abundance estimation for fungal ITS communities from long-read sequencing

Cet article présente EMITS, un outil Rust utilisant l'algorithme de maximisation de l'espérance pour estimer avec précision les abondances d'espèces fongiques à partir de données d'amplicons ITS en lecture longue, surmontant ainsi les limites des méthodes de classification naïves grâce à des validations rigoureuses sur des simulations et des communautés modèles.

O'Brien, A., Lagos, C., Fernandez, K., Ojeda, B., Parada, P.2026-04-02💻 bioinformatics

TF-IDF k-mer-based Classical and Hybrid Machine Learning Models for SARS-CoV-2 Variant Classification under Imbalanced Genomic Data

Cette étude démontre que des modèles d'apprentissage automatique classiques et hybrides, utilisant des caractéristiques TF-IDF basées sur les k-mers, surpassent les méthodes d'apprentissage profond pour la classification précise des variants rares du SARS-CoV-2 dans des contextes de données génomiques fortement déséquilibrées.

Haque, N., Mazed, A., Ankhi, J. N., Uddin, M. J.2026-04-02💻 bioinformatics

Benchmarking Heritability Estimation Strategies Across 86 Configurations and Their Downstream Effect on Polygenic Risk Score Performance

Cette étude démontre que, bien que les estimations d'héritabilité SNP varient considérablement selon la méthode d'estimation utilisée, cette variabilité en amont n'a qu'un impact négligeable sur les performances des scores de risque polygéniques, suggérant que ces scores sont robustes aux fluctuations modérées des paramètres d'héritabilité.

Muneeb, M., Ascher, D.2026-04-02💻 bioinformatics

Inferring a novel insecticide resistance metric and exposurevariability in mosquito bioassays across Africa

Cette étude propose un nouveau modèle mathématique intégrant l'hétérogénéité de la résistance aux insecticides mesurée par des bioessais à dose d'intensité pour prédire avec précision l'efficacité des moustiquaires dans les essais en hutte expérimentale, permettant ainsi d'évaluer plus finement l'impact de la résistance sur la santé publique en Afrique.

Denz, A., Kont, M. D., Sanou, A., Churcher, T. S., Lambert, B.2026-04-01💻 bioinformatics