La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Universal physical principles govern the deterministic genesis of protein structure

En introduisant le cadre unifié ProtGenesis, cette étude établit que la genèse des protéines est un processus physique déterministe régi par trois principes universels d'assemblage, d'émergence et de transition de phase, offrant ainsi une fondation mathématique interprétable pour déverrouiller les modèles d'apprentissage profond et comprendre le blueprint moléculaire de la vie.

Chuanyang, L., Liu, J., Qiu, X., Wu, X., Li, W., Min, L., Zhang, G., Zhang, S., Zhu, L.2026-02-23💻 bioinformatics

Comprehensive top-down mass spectral repository enables pan-dataset analysis and top-down spectral prediction

Le papier présente TopRepo, le premier dépôt complet de spectres de spectrométrie de masse top-down comprenant plus de 18 millions de spectres, qui permet des analyses pan-ensemble de données et améliore considérablement l'identification des protéines ainsi que la prédiction spectrale via l'apprentissage profond.

Li, K., Liu, K., Fulcher, J. M., Tang, H., Liu, X.2026-02-23💻 bioinformatics

CellAwareGNN: Single-Cell Enhanced Knowledge Graph Foundation Model for Drug Indication Prediction

Ce papier présente CellAwareGNN, un modèle fondamental de graphes enrichi par des données de génomique à l'échelle cellulaire qui améliore significativement la prédiction des indications médicamenteuses, en particulier pour les maladies auto-immunes, par rapport aux modèles existants comme TxGNN.

Zhang, X., Jeong, E., Yan, C., Feng, Y., Lyu, L., Guo, X., Chen, Y.2026-02-23💻 bioinformatics

Inference of cancer driver mutations from tumor microenvironmentcomposition: a pan-cancer study with cross-platform external validation

Cette étude pan-cancéreuse démontre que la composition du microenvironnement tumoral, déduite de signatures transcriptomiques, permet de prédire avec précision le statut des mutations conductrices dans plusieurs types de cancers, comme confirmé par une validation externe sur des cohortes indépendantes.

Baker, E. A., Mehaffy, N. S.2026-02-23💻 bioinformatics

MetaTracer: A nucleotide alignment-based framework for high-resolution taxonomic and transcript assignment in metatranscriptomic data

MetaTracer est un outil d'alignement nucléotidique qui permet d'attribuer simultanément les lectures de métagénomique à des groupes taxonomiques et à des gènes exprimés avec une haute résolution, facilitant ainsi l'analyse précise de l'activité transcriptionnelle spécifique aux espèces au sein de communautés bactériennes complexes.

Furstenau, T., Shaffer, I., Hsu, K.-L. C., Pearson, T., Ernst, R. K., Fofanov, V.2026-02-23💻 bioinformatics

What makes a banana false? How the genome of Ethiopian orphan staple Ensete ventricosum differs from the banana A and B sub-genomes

Cette étude présente un assemblage de novo du génome de l'enset (Ensete ventricosum), révélant qu'environ 25 % de son génome lui est unique par rapport aux bananiers, ce qui fournit des ressources cruciales pour comprendre son adaptation et développer des stratégies de sélection assistée par marqueurs afin d'améliorer la sécurité alimentaire en Éthiopie.

Muzemil, S., Paul, P., Baxter, L., Dominguez-Ferreras, A., Sahu, S. K., Van Deynze, A., Mai, G., Yemataw, Z., Tesfaye, K., Ntoukakis, V., Studholme, D. J., Grant, M.2026-02-23💻 bioinformatics

Hierarchical Multi-Omics Trajectory Prediction forFecal Microbiota Transplantation: A Novel MachineLearning Framework for Small-Sample LongitudinalMulti-Omics Integration

Cet article présente HMOTP, un cadre d'apprentissage automatique innovant intégrant des données multi-omiques longitudinales à faible échantillon pour prédire avec précision les trajectoires individuelles des patients après une transplantation de microbiote fécal tout en identifiant des biomarqueurs interprétables grâce à une construction hiérarchique de caractéristiques et des mécanismes d'attention multi-niveaux.

Zhou, Y.-H., Sun, G.2026-02-23💻 bioinformatics

Interpretable transcriptome-to-phenotype modeling of cell-painting nuclear morphology features from RNA-seq under low-dose radiation exposure

Cette étude présente un cadre de modélisation inverse interprétable et stratifié dans le temps qui relie les réponses transcriptomiques aux changements de morphologie nucléaire observés par imagerie cellulaire après une exposition à des radiations à faible dose, en utilisant une approche de régression élastique-net pour identifier des prédicteurs génétiques stables tout en contrôlant les tendances de dose.

Jantre, S., Chopra, K., Zhao, G., Cucinell, C., Weinberg, R., Forrester, S., Brettin, T., Urban, N. M., Qian, X., Yoon, B.-J.2026-02-23💻 bioinformatics