La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

DeepTrio: Variant Calling in Families Using Deep Learning

DeepTrio est un modèle d'apprentissage profond qui améliore la précision du décodage des variants génétiques dans les trios familiaux (enfant, mère, père) en apprenant directement à partir des données de séquençage, surpassant ainsi les performances de DeepVariant sur les données Illumina et PacBio HiFi, y compris à des couvertures plus faibles.

Brambrink, L., Kolesnikov, A., Goel, S., Nattestad, M., Yun, T., Baid, G., Yang, H., McLean, C., Shafin, K., Chang, P.-C., Carroll, A.2026-04-02💻 bioinformatics

Optimisation of Weighted Ensembles of Genomic Prediction Models in Maize

Cette étude évalue l'optimisation des poids dans les ensembles de modèles de prédiction génomique du maïs via trois approches, démontrant que l'ajustement des poids améliore la performance prédictive par rapport à une moyenne naïve, bien qu'aucune méthode d'optimisation ne se soit révélée systématiquement supérieure aux autres.

Tomura, S., Powell, O. M., Wilkinson, M. J., Lefevre, J., Cooper, M.2026-04-02💻 bioinformatics

Benchmarking Agentic Bioinformatics Systems for Complex Protein-Set Retrieval: A Coccolithophore Calcification Case Study

Cette étude de cas évalue trois systèmes d'agents bioinformatiques pour la récupération de protéines liées à la calcification des coccolithophores, démontrant que le système Codex offre le meilleur équilibre entre pertinence, spécificité et stabilité par rapport aux volumes de données plus importants mais moins précis de DeerFlow et Biomni.

Zhang, X.2026-04-02💻 bioinformatics

Resolution of recursive data corruption to transform T-cell epitope discovery

Ce papier révèle que les biais de confirmation dans les données d'immunopéptidomique faussent les benchmarks de prédiction d'épitopes T, et propose le modèle deepMHCflare, entraîné sur des données nettoyées, qui démontre une supériorité significative et une validation préclinique réussie pour la découverte d'épitopes.

Preibisch, G., Tyrolski, M., Kucharski, P., Gizinski, S., Grzegorczyk, P., Moon, S., Kim, S., Zaro, B., Gambin, A.2026-04-02💻 bioinformatics

Towards a Cytometry Foundation Model: Interpretable Sample-level Predictive Modelling via Pretrained Transformers

Ce papier présente le GPCT, un modèle de transformateur préentraîné et interprétable qui surmonte les limitations liées à la variabilité des marqueurs en flow cytométrie, permettant une modélisation prédictive robuste au niveau des échantillons et la validation biologique des sous-populations cellulaires déterminantes.

Zhuang, Z., Mashford, B. S., Zheng, L., Andrews, T. D.2026-04-02💻 bioinformatics

DESPOT: Direction-Enhanced Scoring POTentials

Le papier présente DESPOT, un cadre de potentiels de connaissances anisotropes qui améliore considérablement le score des poses et le criblage virtuel en modélisant les préférences directionnelles des interactions protéine-ligand via une formulation probabiliste inversée, surpassant ainsi les méthodes isotropes traditionnelles.

Poelmans, R., Bruncsics, B., Arany, A., Van Eynde, W., Shemy, A., Moreau, Y., Voet, A. R.2026-04-02💻 bioinformatics