La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Genomic-island cassette architecture drives pathogenic Enterococcus cecorum lineages: Cassette2Vec-EC, a structural genomics and machine-learning framework

Cet article présente Cassette2Vec-EC, un cadre intégrant la génomique structurelle et l'apprentissage automatique qui modélise l'architecture des îlots génétiques d'Enterococcus cecorum sous forme de modules transférables pour prédire avec précision les lignées pathogènes et identifier des cibles de surveillance spécifiques.

Goswami, A., Rafi, S., Lagad, R.2026-02-21💻 bioinformatics

ProteoMapper: Alignment-Aware Identification and Quantitative Analysis of Contextual Motif-Domain Patterns in Protein Families

ProteoMapper est un cadre computationnel qui intègre l'annotation des domaines et la détection de motifs pour quantifier leurs relations spatiales au sein des familles de protéines, permettant ainsi une analyse évolutive et fonctionnelle précise sans nécessiter de compétences en programmation.

Sefa, S. M., Sarkar, J., Robin, A. H. K., Uddin, M.2026-02-20💻 bioinformatics

Geometric-aware and interpretable deep learning for single-cell batch correction via explicit disentanglement and optimal transport

L'article présente iDLC, un cadre d'apprentissage profond interprétable qui corrige efficacement les effets de lot dans les données de séquençage ARN de cellules uniques en séparant explicitement les composantes biologiques et techniques via un désentanglement de caractéristiques et un alignement de distributions régularisé par le transport optimal, tout en préservant la fidélité biologique et en s'adaptant à des jeux de données à grande échelle.

Jiang, C., Zheng, R., Ji, Y., Cao, S., Fang, Y., Wang, Z., Wang, R., Liang, S., Tao, S.2026-02-20💻 bioinformatics

TSUMUGI: a platform for phenotype-driven gene network identification from comprehensive knockout mouse phenotyping data

TSUMUGI est une plateforme qui exploite les données de phénotypage systématique de souris knock-out de l'IMPC pour identifier et explorer des réseaux de gènes liés à des phénotypes spécifiques, facilitant ainsi l'interprétation des fonctions génétiques complexes et la génération d'hypothèses sur les maladies humaines.

Kuno, A., Matsumoto, K., Taki, T., Takahashi, S., Mizuno, S.2026-02-20💻 bioinformatics

A New Sparse Bayesian Quantile Neural Network-based Approach and Its Application to Discover Physiological Sweet Spots in the Canadian Longitudinal Study on Aging

En s'appuyant sur les données de l'Étude longitudinale canadienne sur le vieillissement, cette étude propose une nouvelle approche d'apprentissage profond bayésien sparse, le Q-FSNet et le Q-DirichNet, pour identifier 25 métabolites présentant des « points optimaux » physiologiques qui minimisent l'accélération de l'âge biologique, offrant ainsi un outil interprétable pour la médecine de précision.

Min, J., Vishnyakova, O., Brooks-Wilson, A., Elliott, L. T.2026-02-20💻 bioinformatics