La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Evaluating Limits of Machine Learning-Assisted Raman Spectroscopy in Classification of Biological Samples

Cette étude démontre que la qualité des données et la similarité spectrale, plutôt que les algorithmes d'apprentissage automatique eux-mêmes, constituent les principaux facteurs limitant la précision de la classification des échantillons biologiques par spectroscopie Raman assistée par ML, soulignant ainsi l'importance cruciale de la préparation des échantillons, de la réduction du bruit et de l'étalonnage des instruments.

Yadav, A., Birkby, A., Armstrong, N., Arnob, A., Chou, M.-H., Fernandez, A., Verhoef, A. J., Yi, Z., Gulati, S., Kotnis, S., Sun, Q., Kao, K. C., Wu, H.-J.2026-03-01💻 bioinformatics

MolX: A Geometric Foundation Model for Protein-Ligand Modelling

Le modèle fondamental MolX, basé sur des transformateurs de graphes équivariants E(3) et préentraîné sur des millions de structures 3D, permet une modélisation géométrique et chimique conjointe des interactions protéine-ligand, établissant ainsi un état de l'art prédictif et interprétable pour la découverte de médicaments.

Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.2026-03-01💻 bioinformatics

Achieving spatial multi-omics integration from unaligned serial sections with DIME

Le modèle DIME propose une nouvelle approche d'apprentissage profond pour intégrer des données multi-omiques spatiales provenant de coupes sériées non alignées, en combinant l'apprentissage contrastif de graphes et une stratégie d'alignement hybride pour surmonter l'absence d'intersection des caractéristiques et révéler des domaines spatiaux biologiquement significatifs.

Sun, P., Huang, X., Mou, T., Zheng, X.2026-02-28💻 bioinformatics

SpatialCompassV (SCOMV): De novo cell and gene spatial pattern classification and spatially differential gene identification

Le papier présente SpatialCompassV (SCOMV), un outil computationnel qui permet la classification non supervisée des cellules et gènes selon leurs motifs spatiaux et l'identification de gènes différentiels spatiaux en quantifiant leurs positions vectorielles par rapport à des régions d'intérêt, sans dépendre de connaissances biologiques préalables.

Nomura, R., Sakai, S. A., Kageyama, S.-I., Tsuchihara, K., Yamashita, R.2026-02-28💻 bioinformatics

LRSomatic: a highly scalable and robust pipeline for somatic variant calling in long-read sequencing data

LRSomatic est un pipeline Nextflow évolutif et robuste conçu pour le dépistage complet des variants somatiques (SNV, indels, variants structurels et CNV) à partir de données de séquençage long-read (PacBio HiFi et ONT), intégrant également l'analyse épigénétique via Fiber-seq.

Forsyth, R. A., Harbers, L., Verhasselt, A., Iraizos, A.-L. R., Yang, S., Vande Velde, J., Davies, C., Pillay, N., Lambrechts, L., Demeulemeester, J.2026-02-28💻 bioinformatics

Arborist: Prioritizing Bulk DNA Inferred Tumor Phylogenies via Low-pass Single-cell DNA Sequencing Data

Le papier présente ARBORIST, une nouvelle méthode qui améliore la reconstruction des phylogénies tumorales en priorisant les arbres déduits du séquençage ADN de masse grâce à l'intégration de données de séquençage ADN de cellule unique à faible couverture via une inférence variationnelle.

Weber, L. L., Ching, C. Y., Ly, C., Pan, Y., Cheng, Y., Gao, C., Van Loo, P.2026-02-28💻 bioinformatics

Nanopore sequencing reaches amplicon sequence variant (ASV) resolution

Cette étude démontre que, grâce aux récentes améliorations de la précision, le séquençage par nanopores permet désormais de générer directement des variants de séquence d'amplicons (ASV) fiables à partir de lectures brutes pour des amplicons de 250 à 4 200 pb, offrant ainsi une résolution précise des communautés microbiennes complexes sans dépendre de bases de données de référence.

Riisgaard-Jensen, M., Villanelo, S. A. R., Andersen, K. S., Kirkegaard, R., Hansen, S. H., Jiang, C., Stefansen, A. V., Thomsen, J. H. D., Nielsen, P. H., Dueholm, M. K. D.2026-02-28💻 bioinformatics

ESMRank reveals a transferable axis of protein mutational constraint from overlapping variant effect assays

Cette étude présente ESMRank, un prédicteur de l'effet des variants protéiques qui, en exploitant la redondance des assays multiplexés (MAVEs) pour établir une hiérarchie de contrainte mutational transférable, surpasse les méthodes existantes et offre des insights mécanistiques sur la pathogénicité et la fonction protéique.

Arnese, R., Gambardella, G.2026-02-28💻 bioinformatics