La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Fast structural search for classification of gut bacterial mucin O-glycan degrading enzymes

Le papier présente DEFT, une nouvelle méthode d'apprentissage profond qui combine les approches basées sur la séquence et la structure pour améliorer la précision et l'efficacité de la prédiction des numéros EC, permettant ainsi une annotation à haut débit des enzymes bactériennes dégradant les mucines intestinales.

Erden, M., Schult, T., Yanagi, K., Sahoo, J. K., Kaplan, D. L., Cowen, L. J., Lee, K.2026-02-18💻 bioinformatics

Resolving Genome-to-Phenotype Links in Bacteria: Machine-Learned Inference from Downsampled k-mer Representations

Cette étude démontre qu'un algorithme de sous-échantillonnage basé sur les préfixes permet de réduire la taille des génomes bactériens tout en maintenant une haute précision prédictive pour les phénotypes, surpassant les architectures d'apprentissage profond complexes et offrant une voie prometteuse vers des modèles de langage génomique légers et interprétables.

Regueira, T. G. B., Barra, C., Lund, O.2026-02-18💻 bioinformatics

Information-Content-Informed Kendall-tau Correlation Methodology: Interpreting Missing Values in Metabolomics as Potentially Useful Information

Cet article présente la méthodologie ICI-Kt, qui interprète les valeurs manquantes de type censuré à gauche dans les données métabolomiques comme des informations utiles pour améliorer le calcul de la corrélation de Kendall-tau, la détection d'échantillons aberrants et la construction de réseaux de caractéristiques.

Flight, R. M., Bhatt, P. S., Moseley, H. N. B.2026-02-17💻 bioinformatics

ProteomeLM: A proteome-scale language model enables accurate and rapid prediction of protein-protein interactions and gene essentiality across taxa

Le modèle linguistique ProteomeLM, entraîné sur des protéomes entiers, permet de prédire avec une grande précision et rapidité les interactions protéine-protéine et l'essentialité des gènes à travers diverses espèces, surpassant les méthodes traditionnelles basées sur les séquences.

Malbranke, C., Zalaffi, G. P., Bitbol, A.-F.2026-02-17💻 bioinformatics

A Robust Framework for Predicting Mutation Effects on Transcription Factor Binding: Insights from Mutational Signatures in 560 Breast CancerGenomes

Cette étude présente un cadre robuste basé sur des modèles de régression linéaire pour prédire l'impact des mutations somatiques sur la liaison des facteurs de transcription dans 560 génomes de cancer du sein, révélant que des processus mutationnels spécifiques réorganisent systématiquement les réseaux de régulation génique de manière dépendante du sous-type tumoral.

Kilinc, H. H., Otlu, B.2026-02-17💻 bioinformatics

Evaluating Single-Cell Perturbation Response Models Is Far from Straightforward

Cette étude démontre que l'évaluation des modèles de réponse aux perturbations cellulaires uniques est entravée par des métriques inadéquates et des attentes excessives, révélant que les modèles complexes surpassent rarement des baselines simples et appelant à l'établissement de directives d'évaluation robustes pour un benchmarking fiable.

Heidari, M., Karimpour, M., Srivatsa, S., Montazeri, H.2026-02-17💻 bioinformatics

Ancestry-specific performance of variant effect predictors in clinical variant classification

Bien que les prédicteurs d'effets de variants soient souvent entraînés sur des données non représentatives, cette étude démontre que, une fois ajustés pour les fréquences alléliques, leurs performances restent comparables entre les principaux groupes d'ascendance, ce qui soutient leur déploiement responsable dans le diagnostic génétique.

Hoffing, R., Zeiberg, D., Stenton, S. L., Mort, M., Cooper, D. N., Hahn, M. W., O'Donnell-Luria, A., Ward, L. D., Radivojac, P.2026-02-17💻 bioinformatics