La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Non-consensus flanking sequence of hundreds of base pairs around in vivo binding sites: statistical beacons for transcription factor scanning

En analysant des sites de liaison in vivo, cette étude révèle que des séquences flanquantes étendues de 1000 à 1500 pb présentent un enrichissement significatif en GC et des altérations directionnelles des fréquences de dinucléotides, suggérant un mécanisme de « balayage » grossier facilitant la recherche des cibles par les facteurs de transcription.

Faltejskova, K., Sulc, J., Vondrasek, J.2026-03-10💻 bioinformatics

GREmLN: A Cellular Graph Structure Aware Transcriptomics Foundation Model

Le papier présente GREmLN, un modèle fondamental d'apprentissage profond qui intègre la structure des graphes de régulation génique directement dans son mécanisme d'attention pour capturer les dépendances régulatrices à longue portée dans les données de transcriptomique à cellule unique, surpassant ainsi les modèles de référence existants sur diverses tâches biologiques.

Zhang, M., Swamy, V., Cassius, R., Dupire, L., Kanatsoulis, C., Paull, E., AlQuraishi, M., Karaletsos, T., Califano, A.2026-03-10💻 bioinformatics

Generating Hybrid Proteins with the MSA-Transformer

Cette étude présente un cadre itératif stochastique exploitant le MSA-Transformer pour générer des protéines hybrides fonctionnelles entre deux séquences homologues, en combinant des techniques de masquage intelligent, de recherche par faisceau et d'analyse structurelle pour explorer de manière plausible l'espace des séquences tout en préservant les motifs catalytiques essentiels.

Tule, S., Davis, S., Koludarov, I., Mora, A., Boden, M.2026-03-10💻 bioinformatics

Bridging the gap between genome-wide association studies and network medicine with GNExT

Cet article présente GNExT, une plateforme web open-source qui comble le fossé entre les études d'association pangénomique (GWAS) et la médecine des réseaux en intégrant des outils d'analyse comme MAGMA et Drugst.One pour transformer les signaux génétiques isolés en modules biologiques cohérents, facilitant ainsi la découverte de mécanismes de maladies et le repositionnement de médicaments à grande échelle.

Arend, L., Woller, F., Rehor, B., Emmert, D., Frasnelli, J., Fuchsberger, C., Blumenthal, D. B., List, M.2026-03-10💻 bioinformatics

Generating Joint Transcriptomic and Morphological Responses to Drug Perturbations via Rectified Flow

Le papier présente PertFlow, un cadre computationnel unifié basé sur le flux rectifié capable de prédire simultanément les profils d'expression génique et de générer des images morphologiques cellulaires en réponse à des perturbations médicamenteuses, comblant ainsi une lacune majeure dans la modélisation conjointe des réponses transcriptomiques et phénotypiques.

Verma, S., Wang, M., Wang, L., Sola, M., Kazemian, M., Grama, A., Lanman, N. A.2026-03-10💻 bioinformatics

scProfiterole: Clustering of Single-Cell Proteomic DataUsing Graph Contrastive Learning via Spectral Filters

Ce papier présente scProfiterole, un cadre de calcul innovant utilisant l'apprentissage contrastif sur graphes et des filtres spectraux approximés par interpolation polynomiale pour améliorer le regroupement et l'identification des types cellulaires dans les données de protéomique monocellulaire, qui sont souvent affectées par des données manquantes et du bruit.

Coskun, M., Lopes, F. B., Kubilay Tolunay, P., Chance, M. R., Koyuturk, M.2026-03-10💻 bioinformatics