La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

ProtFlow: Flow Matching-based Protein Sequence Design with Comprehensive Protein Semantic Distribution Learning and High-quality Generation

ProtFlow est un modèle génératif basé sur l'appariement de flux (flow matching) qui, en apprenant la distribution sémantique globale des protéines et en intégrant des représentations de modèles de langage, permet de concevoir des séquences protéiques de haute qualité, notamment des peptides antimicrobiens efficaces contre des pathogènes sous-représentés.

Kong, Z., Zhu, Y., Xu, Y., Yin, M., Hou, T., Wu, J., Xu, H., Hsieh, C.-Y.2026-02-17💻 bioinformatics

A Robust Framework for Predicting Mutation Effects on Transcription Factor Binding: Insights from Mutational Signatures in 560 Breast CancerGenomes

Cette étude présente un cadre robuste basé sur des modèles de régression linéaire pour prédire l'impact des mutations somatiques sur la liaison des facteurs de transcription dans 560 génomes de cancer du sein, révélant que des processus mutationnels spécifiques réorganisent systématiquement les réseaux de régulation génique de manière dépendante du sous-type tumoral.

Kilinc, H. H., Otlu, B.2026-02-17💻 bioinformatics

Evaluating Single-Cell Perturbation Response Models Is Far from Straightforward

Cette étude démontre que l'évaluation des modèles de réponse aux perturbations cellulaires uniques est entravée par des métriques inadéquates et des attentes excessives, révélant que les modèles complexes surpassent rarement des baselines simples et appelant à l'établissement de directives d'évaluation robustes pour un benchmarking fiable.

Heidari, M., Karimpour, M., Srivatsa, S., Montazeri, H.2026-02-17💻 bioinformatics

Ancestry-specific performance of variant effect predictors in clinical variant classification

Bien que les prédicteurs d'effets de variants soient souvent entraînés sur des données non représentatives, cette étude démontre que, une fois ajustés pour les fréquences alléliques, leurs performances restent comparables entre les principaux groupes d'ascendance, ce qui soutient leur déploiement responsable dans le diagnostic génétique.

Hoffing, R., Zeiberg, D., Stenton, S. L., Mort, M., Cooper, D. N., Hahn, M. W., O'Donnell-Luria, A., Ward, L. D., Radivojac, P.2026-02-17💻 bioinformatics

A Discrete Language of Protein Words for Functional Discovery and Design

Cet article présente un cadre d'apprentissage physique qui discrétise les séquences protéiques en un vocabulaire de « mots » évolutifs, permettant non seulement d'améliorer la prédiction fonctionnelle et l'analyse de l'évolution, mais aussi de découvrir de nouveaux régulateurs biologiques et de concevoir des variants protéiques fonctionnels.

Guo, Z., Wang, Z., Chai, Y., XU, K., Li, M., Li, W., Ou, G.2026-02-17💻 bioinformatics

TITAN-BBB: Predicting BBB Permeability using Multi-Modal Deep-Learning Models

Ce papier présente TITAN-BBB, un modèle d'apprentissage profond multimodal qui intègre des caractéristiques tabulaires, visuelles et textuelles pour prédire la perméabilité de la barrière hémato-encéphalique avec une précision supérieure aux méthodes actuelles, tout en mettant à disposition le plus grand jeu de données agrégé et les outils correspondants.

de Oliveira, G. B., Saeed, F.2026-02-17💻 bioinformatics

FiCOPS: Hardware/Software Co-Design of FPGA Computational Framework for Mass Spectrometry-Based Peptide Database Search

Ce papier présente FiCOPS, un cadre de calcul sur FPGA conçu par co-conception matériel/logiciel pour accélérer la recherche de peptides dans les bases de données de spectrométrie de masse, offrant une accélération de 3,5 fois par rapport aux solutions CPU tout en réduisant significativement la consommation énergétique.

Kumar, S., Zambreno, J., Khokhar, A., Akram, S., Saeed, F.2026-02-17💻 bioinformatics