La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

FM-GPT: Bayesian fine mapping for phenome-wide transcriptome-wide association studies

Les auteurs présentent FM-GPT, une nouvelle méthode bayésienne de cartographie fine conçue pour identifier des gènes causaux dans les études d'association pan-phénotypiques sur l'expression génique, permettant de distinguer les effets pléiotropes et spécifiques aux phénotypes tout en réduisant les faux positifs grâce à une réduction de dimensionnalité guidée par les gènes.

Canida, T., Ye, Z., Wang, S.-H., Huang, H.-H., Pan, Y., Liang, M., Chen, S., Ma, T.2026-04-11💻 bioinformatics

A unified spatial transcriptome profiling of ten mouse organs

Cet article présente un ensemble de données unifié de transcriptomique spatiale couvrant dix organes de souris, généré via la plateforme Stereo-seq avec des images histologiques appariées et des annotations cellulaires, offrant une ressource standardisée pour le développement de modèles d'apprentissage profond et l'analyse multimodale.

Ren, X., Lv, T., Liu, N., Shi, C., Fang, J., Zhao, N., Kang, Q., Wang, D.2026-04-11💻 bioinformatics

scMultiPreDICT: A single-cell predictive framework with transcriptomic and epigenetic signatures

Le cadre computationnel scMultiPreDICT, développé en R, permet d'évaluer de manière comparative la capacité prédictive des signatures transcriptomiques et épigénétiques sur l'expression génique, révélant que l'intégration multimodale améliore la précision de manière spécifique aux gènes et au contexte cellulaire plutôt que de manière uniforme.

Manful, E.-E., Uzun, Y.2026-04-11💻 bioinformatics

Metabolomic Fingerprinting from Dried Blood Spots Enables Individual Identification Across 1,257 Participants at 94% User-Level Accuracy

Cette étude valide à grande échelle que le profilage métabolomique non ciblé de taches de sang séché permet d'identifier individuellement des participants avec une précision de 94 %, ouvrant la voie à des applications cliniques pour le jumelage d'échantillons et la création de jumeaux numériques.

Hauguel, P., Anctil, N., Noel, L. P.2026-04-11💻 bioinformatics

Evaluation of somatic variant calling methods on high coverage tumour-only amplicon sequencing data in a clinical environment

Cette étude évalue la performance de six outils de détection de variants somatiques intégrés dans un pipeline Snakemake sur des données de séquençage amplicon tumoral-only de référence, révélant que FreeBayes, VarScan, MuTect2 et Pisces offrent les meilleurs résultats bien que FreeBayes génère davantage d'artefacts.

Bharne, D., Gaston, D.2026-04-11💻 bioinformatics

RNA Folding Nearest Neighbor Parameters Including the Modification 1-Methyl-Pseudouridine

Cette étude présente de nouveaux paramètres de voisinage le plus proche pour l'ARN intégrant la modification 1-méthyl-pseudouridine, dérivés de 208 expériences de fusion optique, qui permettent d'estimer avec précision la stabilité de l'ARN et d'améliorer la modélisation des structures secondaires, notamment pour les vaccins à ARNm.

Kierzek, E., Shabangu, T. S., Hiltke, O. M., Miaro, M., Arteaga, S., Znosko, B. M., Jolley, E. A., Bevilacqua, P. C., SantaLucia, J., SantaLucia, H. A., Lin, H., Metkar, M., Aviran, S., Soszynska-Jozw (…)2026-04-11💻 bioinformatics

Generative design of intrinsically disordered protein regions with IDiom

Cet article présente IDiom, un modèle de langage protéique autoregressif entraîné sur des millions de séquences de régions désordonnées intrinsèques, capable de générer de nouvelles séquences biologiquement pertinentes et de les optimiser pour une localisation subcellulaire spécifique, comblant ainsi un vide majeur dans la conception rationnelle de ces protéines.

Liu, J., Ibarraran, S., Hu, F., Park, A., Dunn, A., Rotskoff, G.2026-04-11💻 bioinformatics