La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

Cette étude présente le plus grand atlas de transcriptomique à cellule unique harmonisé du macaque crabier (Macaca fascicularis), enrichi par des annotations issues d'un modèle fondamental humain, offrant une ressource cruciale pour améliorer la qualification des cibles thérapeutiques, interpréter les mécanismes de toxicité et réduire l'utilisation des primates non humains dans la recherche préclinique.

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics

ProteinSage: From implicit learning to explicit structural constraints for efficient protein language modeling

Le papier présente ProteinSage, un cadre d'apprentissage prédictif qui intègre des contraintes structurelles explicites pour développer des représentations de protéines plus efficaces et fidèles, permettant notamment la découverte de nouveaux homologues de rhodopsines microbiennes.

Shen, L., Chao, L., Liu, T., Liu, Q., Zhou, G., Wang, H., Dong, X., Li, T., Zhang, X., Ni, J.2026-03-19💻 bioinformatics

evedesign: accessible biosequence design with a unified framework

Ce papier présente evedesign, un cadre open-source unifié et accessible qui permet la conception de séquences biologiques conditionnelles et multi-objectifs via une interface interactive, facilitant ainsi l'intégration itérative de données expérimentales pour des applications telles que l'ingénierie d'anticorps et d'enzymes.

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

Cette étude présente un flux de travail guidé par la structure permettant d'identifier, de classifier et de réanoter de manière rigoureuse l'ensemble des dépôts de cytochromes P450 dans la Protein Data Bank, aboutissant à la création d'un registre curé et automatisé qui résout les problèmes d'incohérence de nomenclature et facilite les analyses à grande échelle de cette super-famille enzymatique.

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

SELFormerMM: multimodal molecular representation learning via SELFIES, structure, text, and knowledge graph integration

Le papier présente SELFormerMM, un cadre d'apprentissage multimodal qui intègre les notations SELFIES, les structures moléculaires, les descriptions textuelles et les graphes de connaissances pour générer des représentations moléculaires enrichies surpassant les approches unimodales dans la découverte de médicaments.

Ulusoy, E., Bostanci, S., Deniz, B. E., Dogan, T.2026-03-19💻 bioinformatics

Super Bloom: Fast and precise filter for streaming k-mer queries

Ce papier présente le Super Bloom Filter, une variante optimisée des filtres de Bloom pour les requêtes de k-mers en flux continu qui combine l'utilisation de minimizers pour regrouper les k-mers adjacents et le schéma findere pour améliorer l'efficacité du cache et réduire considérablement les faux positifs, surpassant ainsi les implémentations existantes en vitesse et en précision.

Conchon-Kerjan, E., Rouze, T., Robidou, L., Ingels, F., Limasset, A.2026-03-19💻 bioinformatics