La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

VarDCL: A Multimodal PLM-Enhanced Framework for Missense Variant Effect Prediction via Self-distilled Contrastive Learning

L'article présente VarDCL, un cadre d'apprentissage contrastif auto-distillé qui intègre des modèles de langage protéiques multimodaux pour prédire avec une grande précision les effets pathogènes des variants faux-sens, surpassant ainsi les méthodes existantes sur des données cliniques.

Zhang, H., Zheng, G., Xu, Z., Zhao, H., Cai, S., Huang, Y., Zhou, Z., Wei, Y.2026-03-17💻 bioinformatics

RIBEX: Predicting and Explaining RNA Binding Across Structured and Intrinsically Disordered Regions (IDR)-rich Proteins

RIBEX est un cadre multimodal innovant qui améliore la prédiction et l'explication des protéines liant l'ARN en intégrant les représentations de séquence issues de modèles de langage protéique avec la topologie des interactions protéiques, surpassant ainsi les méthodes actuelles, notamment pour les protéines riches en régions intrinsèquement désordonnées.

Firmani, S., Steinbauer, F., Kasneci, G., Horlacher, M., Marsico, A.2026-03-17💻 bioinformatics

Eco-Evolutionary Dynamics of Proliferation Heterogeneity: A Phenotype-Structured Model for Tumor Growth and Treatment Response

En développant un modèle d'équations aux dérivées partielles structuré par le phénotype qui intègre la diffusion, la compétition pour les ressources et un compromis vie-mortalité, cette étude révèle comment les régimes thérapeutiques ciblent sélectivement différentes sous-populations de prolifération, modifiant ainsi la dynamique évolutive et la résistance adaptative des tumeurs.

Schmalenstroer, L., Rockne, R. C., Farahpour, F.2026-03-17💻 bioinformatics

Glydentify: An explainable deep learning platform for glycosyltransferase donor substrate prediction

Le papier présente Glydentify, une plateforme d'apprentissage profond explicable qui prédit avec précision les substrats donneurs des glycosyltransférases en intégrant des embeddings de séquences protéiques et des caractéristiques chimiques, validant ainsi son efficacité par des essais biochimiques et une analyse d'attention des résidus.

Fang, R., Na, L., Corulli, C. J., Prabhakar, P. K., Berardinelli, S. J., Venkat, A., Prasad, A., Mahmud, R., Moremen, K. W., Urbanowicz, B. R., Dou, F., Kannan, N.2026-03-17💻 bioinformatics

Integrated Artificial Intelligence and Quantum Chemistry Approach for the Rational Design of Novel Antibacterial Agents against Ralstonia solanacearum.

Cette étude présente la conception rationnelle et la validation computationnelle de Solres, une nouvelle molécule antibactérienne ciblant les protéines de virulence de *Ralstonia solanacearum* grâce à une approche intégrée combinant intelligence artificielle, chimie quantique et simulations moléculaires pour lutter contre la résistance aux antimicrobiens en agriculture.

Gulumbe, D. A., Tiwari, G., Lohar, T., Nikam, R., Kumar, A., Giri, S.2026-03-17💻 bioinformatics

Single-Pass Discrete Diffusion Predicts High-Affinity Peptide Binders at >1,000 Sequences per Second across 150 Receptor Targets

Le modèle de diffusion discrète LigandForge révolutionne la conception de peptides en générant des séquences à haute affinité pour 150 cibles réceptrices à une vitesse de plus de 1 000 séquences par seconde sans prédiction de structure, surpassant ainsi les méthodes existantes en termes de débit, de diversité structurale et de capacité à cibler des complexes protéiques complexes.

Watson, A.2026-03-17💻 bioinformatics

RNAElectra: An ELECTRA-Style RNA Foundation Model for RNA Regulatory Inference

Ce papier présente RNAElectra, un modèle de fondation pour l'ARN préentraîné selon une approche ELECTRA avec détection de tokens remplacés (RTD) plutôt qu'un masquage classique, ce qui lui permet de surpasser les modèles existants dans la prédiction de diverses régulations et interactions de l'ARN tout en offrant une meilleure interprétabilité.

Ding, K., Liu, L., Parker, B., Wen, J.2026-03-17💻 bioinformatics