La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

TF-IDF k-mer-based Classical and Hybrid Machine Learning Models for SARS-CoV-2 Variant Classification under Imbalanced Genomic Data

Cette étude démontre que des modèles d'apprentissage automatique classiques et hybrides, utilisant des caractéristiques TF-IDF basées sur les k-mers, surpassent les méthodes d'apprentissage profond pour la classification précise des variants rares du SARS-CoV-2 dans des contextes de données génomiques fortement déséquilibrées.

Haque, N., Mazed, A., Ankhi, J. N., Uddin, M. J.2026-04-02💻 bioinformatics

Benchmarking Heritability Estimation Strategies Across 86 Configurations and Their Downstream Effect on Polygenic Risk Score Performance

Cette étude démontre que, bien que les estimations d'héritabilité SNP varient considérablement selon la méthode d'estimation utilisée, cette variabilité en amont n'a qu'un impact négligeable sur les performances des scores de risque polygéniques, suggérant que ces scores sont robustes aux fluctuations modérées des paramètres d'héritabilité.

Muneeb, M., Ascher, D.2026-04-02💻 bioinformatics

SEGUID v2: Extending SEGUID checksums for circular, linear, single- and double-stranded biological sequences

Le papier présente SEGUID v2, une extension du checksum SEGUID original conçue pour générer des sommes de contrôle invariants d'orientation et de rotation pour divers types de séquences biologiques (ADN/ARN linéaires ou circulaires, simple ou double brin), tout en adoptant le codage Base64url pour une compatibilité améliorée avec les systèmes de fichiers et les URL.

Pereira, H., Silva, P. C., Davis, W. M., Abraham, L., Babnigg, G., Bengtsson, H., Johansson, B.2026-04-01💻 bioinformatics

Inferring a novel insecticide resistance metric and exposurevariability in mosquito bioassays across Africa

Cette étude propose un nouveau modèle mathématique intégrant l'hétérogénéité de la résistance aux insecticides mesurée par des bioessais à dose d'intensité pour prédire avec précision l'efficacité des moustiquaires dans les essais en hutte expérimentale, permettant ainsi d'évaluer plus finement l'impact de la résistance sur la santé publique en Afrique.

Denz, A., Kont, M. D., Sanou, A., Churcher, T. S., Lambert, B.2026-04-01💻 bioinformatics

A Convolutional Deep Learning Approach to identify DNA Sequences for Gene Prediction

Cet article présente une méthode d'apprentissage automatique basée sur un réseau de neurones convolutif (CNN) et la vectorisation TFxIDF appliquée à des séquences d'acides aminées dérivées du génome humain GRCh38, permettant d'identifier avec une grande précision les séquences codant pour des gènes et atteignant ainsi l'état de l'art en matière de prédiction génique.

Motta, J. A., Gomez, P. D.2026-04-01💻 bioinformatics

High-throughput prediction of protein-protein interactions uncovers hidden molecular networks in biosynthetic gene clusters

Cette étude présente un pipeline de prédiction à haut débit des interactions protéine-protéine au sein des clusters de gènes biosynthétiques, permettant d'élucider des réseaux moléculaires cachés et d'identifier des complexes enzymatiques fonctionnels impliquant des protéines précédemment inconnues.

Moriwaki, Y., Shiraishi, T., Katsuyama, Y., Matsuda, K., Ose, T., Minami, A., Oikawa, H., Kuzuyama, T., Ishitani, R., Terada, T.2026-04-01💻 bioinformatics