La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

PanXpress: Gene expression quantification with a pan-transcriptomic gapped k-mer index

PanXpress est un cadre unifié et efficace pour l'analyse de l'expression génique bactérienne qui construit directement un index pan-transcriptomique à partir de fichiers génomiques pour quantifier l'expression sans alignement, offrant ainsi une précision supérieure et une meilleure gestion de la diversité des souches par rapport aux méthodes existantes.

Alves Ferreira, I., Zentgraf, J., Schmitz, J. E., Rahmann, S.2026-03-20💻 bioinformatics

Advancing FAIR Data Management through AI-Assisted Curation of Morphological Data Matrices

Cette étude présente un outil d'intelligence artificielle intégré à MorphoBank qui automatise l'extraction et la normalisation des données morphologiques à partir de la littérature, améliorant ainsi la précision, l'efficacité et l'adéquation aux principes FAIR de la gestion des données en systématique et en paléontologie.

Jariwala, S., Long-Fox, B. L., Berardini, T. Z.2026-03-19💻 bioinformatics

GatorSC: Multi-Scale Cell and Gene Graphs with Mixture-of-Experts Fusion for Single-Cell Transcriptomics

Le papier présente GatorSC, un cadre d'apprentissage de représentations unifié qui fusionne des graphes cellulaires et géniques multi-échelles via une architecture à mélange d'experts pour produire des embeddings robustes au bruit, surpassant les méthodes de l'état de l'art dans diverses tâches d'analyse de transcriptomique à cellule unique.

Liu, Y., Zhang, Z., Qiu, M., Wang, S., Salim, F., Shen, J., Chen, T., Razzak, I., Li, F., Bian, J.2026-03-19💻 bioinformatics

Composition and higher-order structure in nucleic acids sequenced from a chondrite

Cette étude analyse des séquences d'acides nucléiques extraites de la météorite Zag, révélant qu'elles présentent une structure complexe et non aléatoire qui échappe aux modèles biologiques connus et aux artefacts techniques, tout en ne correspondant pas à une organisation protéique, ce qui nécessite des investigations indépendantes pour élucider leur origine.

Farage, C., Church, G. M., Bachelet, I.2026-03-19💻 bioinformatics

Leveraging Large Language Models to Extract Prognostic Pathology Features in Ewing Sarcoma

Cette étude démontre que l'utilisation de modèles de langage pour extraire des données histologiques non structurées des rapports de pathologie permet d'identifier avec précision de nouveaux biomarqueurs pronostiques (NSE et S100) dans le sarcome d'Ewing, ouvrant la voie à une stratification des risques plus fine.

Huang, J., Batool, A., Gu, Z., Zhao, Z., Yao, B., Black, J., Davis, J., al-Ibraheemi, A., DuBois, S., Barkauskas, D., Ramakrishnan, S., Hall, D., Grohar, P., Xie, Y., Xiao, G., Leavey, P. J.2026-03-19💻 bioinformatics

Integration of large, complex single-cell datasets with Harmony2

Le papier présente Harmony2, une nouvelle version du logiciel d'intégration qui permet de traiter efficacement et avec précision des atlas de cellules uniques complexes et massifs (dépassant 100 millions de cellules) sans matériel spécialisé, tout en évitant une sur-intégration dans les ensembles de données biologiquement hétérogènes.

Patikas, N., Yao, H., Madhu, R., Raychaudhuri, S., Hemberg, M., Korsunsky, I.2026-03-19💻 bioinformatics

Translating Histopathology Foundation Model Embeddings into Cellular and Molecular Features for Clinical Studies

Le cadre STpath comble le fossé entre les modèles de fondation en histopathologie et la biologie en traduisant les embeddings d'images en compositions cellulaires et en expression génique via des modèles XGBoost, permettant ainsi leur utilisation dans des études cliniques sur le cancer colorectal et du sein.

Cui, S., Sui, Z., Li, Z., Matkowskyj, K. A., Yu, M., Grady, W. M., Sun, W.2026-03-19💻 bioinformatics