La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

CancerSTFormer enables multi-scale analysis of spot-resolution spatial transcriptomes and dissects the gene and immune regulatory responses of targeted therapies

CancerSTFormer est un modèle fondamental de transcriptomique spatiale qui permet une analyse multi-échelle des niches tumorales pour identifier des gènes régulateurs et prédire les réponses aux thérapies ciblées en réutilisant à grande échelle les données existantes.

Strope, B., Varghese, D., Bowie, W., Wang, S., Zhu, Q.2026-03-03💻 bioinformatics

The One Click Wonder: a retrained automated segmentation pipeline that enables quantitative and modular analysis of C. elegans embryos

Les auteurs présentent One Click Wonder (OCW), un pipeline automatisé combinant un modèle Cellpose reentraîné et l'outil d'annotation BAAM, permettant une segmentation précise et une analyse quantitative à l'échelle de la cellule unique de l'expression génique dans les embryons de C. elegans.

Bassett, P. C., Verheijen, T. E., Angonezi, A. L., Andriollo, A., Herbert, S., Roth, G., Chao, J., Mango, S. E.2026-03-03💻 bioinformatics

MetaTree: an interactive web platform for hierarchical data visualization and multi-group comparison

MetaTree est une plateforme web open-source et sans installation qui permet la visualisation interactive et la comparaison statistique de profils hiérarchiques, notamment en microbiologie, en assurant une correspondance univoque des nœuds entre les échantillons pour faciliter l'analyse comparative et la génération de figures prêtes à publier.

Wu, Q., Zhang, A., Ning, Z., Figeys, D.2026-03-03💻 bioinformatics

STCS: A Platform-Agnostic Framework for Cell-Level Reconstruction in Sequencing-Based Spatial Transcriptomics

Le framework STCS est une solution open-source et agnostique de la plateforme qui reconstruit des profils d'expression génique au niveau cellulaire à partir de données de transcriptomique spatiale à haute résolution en intégrant la segmentation des noyaux et un modèle de distance combinant transcriptomique et spatialité, surpassant ainsi les méthodes existantes sans nécessiter d'annotations de référence.

Chen Wu, L., Hu, X., Zhan, F., Sun, C., Gonzales, J., Ofer, R., Tran, T., Verzi, M. P., Liu, L., Yang, J.2026-03-03💻 bioinformatics

snputils: A High-Performance Python Library for Genetic Variation and Population Structure

Le papier présente snputils, une bibliothèque Python open-source haute performance qui unifie l'entrée-sortie, le traitement et l'analyse des données génétiques à l'échelle des biobanques pour surmonter les limitations d'incompatibilité et d'efficacité des outils existants et faciliter des flux de travail reproductibles en génétique des populations.

Bonet, D., Comajoan Cara, M., Barrabes, M., Smeriglio, R., Agrawal, D., Aounallah, K., Geleta, M., Dominguez Mantes, A., Thomassin, C., Shanks, C., Huang, E. C., Franquesa Mones, M., Luis, A., Saurina (…)2026-03-03💻 bioinformatics

A comprehensive assessment of tandem repeat genotyping methods for Nanopore long-read genomes

Cette étude évalue systématiquement sept outils de génotypage de répétitions en tandem sur des données de séquençage Nanopore, démontrant qu'aucune méthode n'est universellement supérieure et soulignant la nécessité d'une analyse au niveau de la séquence plutôt que de la simple longueur pour des applications cliniques et populationnelles fiables.

Aliyev, E., Avvaru, A., De Coster, W., Arner, G. M., Nyaga, D. M., Gibson, S. B., Weisburd, B., Gu, B., Gonzaga-Jauregui, C., 1000 Genomes Long-Read Sequencing Consortium,, Chaisson, M. J. P., Miller (…)2026-03-03💻 bioinformatics

Large-Scale Statistical Dissection of Sequence-Derived Biochemical Features Distinguishing Soluble and Insoluble Proteins

Cette étude statistique à grande échelle sur plus de 78 000 protéines démontre que les déterminants séquentiels de la solubilité sont intrinsèquement de faible signal et fortement redondants, permettant d'identifier un modèle parcimonieux combinant la longueur de la séquence et la proportion de résidus chargés négativement comme base de référence transparente pour la caractérisation de la solubilité.

Vu, N. H. H., Nguyen Bao, L.2026-03-03💻 bioinformatics

The limits of Bayesian estimates of divergence times in measurably evolving populations

Cette étude démontre que, contrairement aux attentes, l'incertitude des estimations de temps de divergence dans les populations évolutives mesurables (comme les virus) dépend de la distance aux calibrations temporelles les plus proches plutôt que de l'âge absolu des nœuds, établissant ainsi des limites théoriques à la précision des inférences bayésiennes même avec des données infinies.

Ivanov, S., Fosse, S., dos reis, M., Duchene, S.2026-03-03💻 bioinformatics

Phenotypic Bioactivity Prediction as Open-set Biological Assay Querying

Ce papier présente OpenPheno, un modèle fondamental multimodal qui redéfinit la prédiction de l'activité biologique comme une tâche de question-réponse en langage naturel et vision par ordinateur, permettant une prédiction en zéro-shot de l'activité de composés sur des assays biologiques inédits à partir d'une seule image Cell Painting, surpassant ainsi les modèles supervisés traditionnels pour accélérer la découverte de médicaments.

Sun, Y., Zhang, X., Zheng, Q., Li, H., Zhang, J., Hong, L., Wang, Y., Zhang, Y., Xie, W.2026-03-03💻 bioinformatics