La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

A Resolution-Agnostic Geometric Transformer for Chromosome Modeling Using Inertial Frame

Cet article présente InertialGenome, un cadre novateur basé sur les transformateurs et l'utilisation d'un repère inertiel pour reconstruire de manière robuste et agnostique à la résolution les structures 3D des chromosomes à partir de données Hi-C, surpassant les méthodes existantes et permettant un transfert d'apprentissage efficace entre différentes résolutions.

Zhou, Y., Li, H., Liu, S.2026-03-05💻 bioinformatics

Single-Cell Omics for Transcriptome CHaracterization (SCOTCH): isoform-level characterization of gene expression through long-read single-cell RNA sequencing

Le pipeline SCOTCH permet une caractérisation robuste et complète des isoformes d'ARNm à l'échelle d'une seule cellule à partir de données de séquençage long-read, en surclassant les méthodes existantes pour la quantification des isoformes connus et la découverte de nouveaux variants.

Xu, Z., Qu, H.-Q., Mu, S., Kao, C., Hakonarson, H., Wang, K.2026-03-04💻 bioinformatics

The FAIRSCAPE AI-readiness Framework for Biomedical Research

Le cadre FAIRSCAPE est un environnement numérique agile qui garantit la préparation des ensembles de données biomédicaux pour l'IA en générant, en évaluant et en gérant automatiquement des métadonnées riches et une traçabilité complète selon 28 critères, assurant ainsi des applications d'IA éthiques, explicables et conformes aux principes FAIR.

Al Manir, S., Levinson, M. A., Niestroy, J., Churas, C., Sheffield, N. C., Sullivan, B., Fairchild, K., Torres, M. M., Ratcliffe, S. J., Parker, J. A., Ideker, T., Clark, T.2026-03-04💻 bioinformatics

HDMAX2-surv: high-dimensional mediation analysis of survival data with application to pancreatic cancer

Cet article présente HDMAX2-surv, un cadre d'analyse de médiation à haute dimension pour les données de survie censurées qui intègre la modélisation de facteurs latents et des modèles de survie flexibles pour identifier des médiateurs épigénétiques, comme démontré par son application réussie aux données de cancer pancréatique du TCGA.

Pittion, F., Amblard, E., Devijver, E., Samson, A., Varoquaux, N., Richard, M.2026-03-04💻 bioinformatics

Sample-specific haplotype-resolved protein isoform characterization via long-read RNA-seq-based proteogenomics

Les auteurs présentent un flux de travail intégré exploitant le séquençage ARN à longues lectures pour construire des protéomes spécifiques à l'échantillon et résolus par haplotype, permettant ainsi une caractérisation précise des isoformes protéiques et des variants alléliques inaccessibles aux méthodes traditionnelles.

Wissel, D., Sheynkman, G. M., Robinson, M. D.2026-03-04💻 bioinformatics

gSV: a general structural variant detector using the third-generation sequencing data

Cet article présente gSV, un détecteur général de variants structuraux intégrant des approches d'alignement et d'assemblage via une stratégie de correspondance exacte maximale (MEM), qui surpasse les outils existants en sensibilité pour identifier des variants complexes dans les données de séquençage de troisième génération, notamment dans le contexte de la génomique du cancer du sein.

HAO, J., Shi, J., Lian, S., Zhang, Z., Luo, Y., Hu, T., Ishibashi, T., Wang, D., Wang, S., Fan, X., Yu, W.2026-03-04💻 bioinformatics

Towards Useful and Private Synthetic Omics: Community Benchmarking of Generative Models for Transcriptomics Data

Cette étude présente un benchmark communautaire de onze modèles génératifs pour la synthèse de données de transcriptomique, révélant des compromis inhérents entre l'utilité biologique, la fidélité des données et la résistance aux attaques de confidentialité qui doivent guider le choix du modèle selon les exigences spécifiques.

Öztürk, H., Afonja, T., Jälkö, J., Binkyte, R., Rodriguez-Mier, P., Lobentanzer, S., Wicks, A., Kreuer, J., Ouaari, S., Pfeifer, N., Menzies, S., Pentyala, S., Filienko, D., Golob, S., McKeever, P (…)2026-03-04💻 bioinformatics

Deciphering the links between metabolism and health by building small-scale knowledge graphs: application to endometriosis and persistent pollutants

Cet article présente Kg4j, un cadre computationnel qui génère des sous-graphes de connaissances localisés à partir d'une base de données à grande échelle pour explorer les liens entre le métabolisme et la santé, démontrant son efficacité dans l'identification de mécanismes plausibles reliant l'exposition aux polluants organiques persistants à l'endométriose tout en intégrant des données expérimentales pour valider et affiner les hypothèses biologiques.

Mathe, M., Laisney, G., Filangi, O., Giacomoni, F., Delmas, M., Cano-Sancho, G., Jourdan, F., Frainay, C.2026-03-04💻 bioinformatics