La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

linearPOA: A parallel, memory-efficient framework for Partial Order Alignment with linear space complexity

Ce papier présente linearPOA, un cadre parallèle et économe en mémoire qui utilise une stratégie de division et de conquête pour atteindre une complexité spatiale linéaire pour l'alignement d'ordre partiel, réduisant considérablement la consommation de mémoire par rapport aux algorithmes quadratiques existants lors du traitement de lectures de séquençage ultra-longues et sujettes aux erreurs.

Wei, Y., Huang, Z., Zhang, P., Tian, Q., Li, Y., Zou, Q., Yu, L.2026-04-30💻 bioinformatics

Species-specific transformer models of bacterial gene order and content for genomic surveillance tasks

Cette étude présente PanBART, un modèle transformateur spécifique à l'espèce entraîné sur le contenu et l'ordre des gènes d'*Escherichia coli* et de *Streptococcus pneumoniae*, démontrant sa capacité supérieure à apprendre de manière non supervisée les structures de population, à identifier les lignées émergentes, à prédire l'acquisition de gènes de résistance aux antibiotiques et à analyser la co-sélection des gènes pour des tâches critiques de surveillance génomique.

Horsfield, S. T., Wiatrak, M., McInerney, J. O., Bentley, S. D., Colijn, C., Lees, J. A.2026-04-30💻 bioinformatics

A Conditional Variational Autoencoder with QSAR-Guided Surrogate-Weighted Fine-Tuning and Cross-Entropy Optimization for Targeted Antimicrobial Peptide Generation

Ce papier présente un pipeline d'autoencodeur variationnel conditionnel qui intègre un ajustement fin pondéré par des substituts guidés par les relations quantitatives structure-activité (QSAR) et une optimisation de l'entropie croisée pour surmonter les défis liés à la rareté des données et à la dépendance circulaire, générant avec succès des peptides antimicrobiens ciblés dotés d'une efficacité prédite élevée et de propriétés structurelles favorables.

Castanon, I., Wan, F., de la Fuente, C., Pini, A., Falciani, C.2026-04-30💻 bioinformatics

Systems Pharmacology Reveals Type I Interferon and Myeloid-Like B Cell Reprogramming as Druggable Axes in Antiphospholipid Syndrome

Cette étude utilise une approche de pharmacologie des systèmes intégrative pour caractériser l'hétérogénéité moléculaire du syndrome des anticorps antiphospholipides, identifiant la signalisation de l'interféron de type I et le reprogrammage des cellules B de type myéloïde comme des axes pharmacologiques clés permettant la stratification des patients et le repositionnement de thérapies existantes pour la médecine de précision.

Sun, B., Lu, Y., Liu, W., Wang, C.2026-04-30💻 bioinformatics

Deterministic retrieval recovers biomedical associations lost by language models

L'article présente BioChirp, un framework open-source qui combine l'interprétation des requêtes par des modèles de langage de grande taille (LLM) avec une récupération déterministe basée sur des graphes pour retrouver davantage d'associations biomédicales avec une reproductibilité supérieure à celle des systèmes conventionnels basés sur des LLM.

Halder, A., Singh, M., Kesarwani, R., Mathew, B., Bhattacharya, N., Chikhaliya, O., Motwani, D., Peela, S. C. M., Samanta, S., Muddemmanavar, P., Farooq, M., Ahuja, G., Sengupta, D.2026-04-29💻 bioinformatics

Explainable Prototype Booster: Enhancing Latent Representations of Foundation Models for Gene Expression Prediction

L'article présente l'Explainable Prototype Booster (EP-Booster), une méthode qui intègre des connaissances biologiques a priori dans des modèles de base pour affiner les représentations latentes en vue d'une prédiction précise et interprétable de l'expression génique à partir d'images histologiques, surmontant ainsi les limitations de coût et de temps de la transcriptomique spatiale.

Li, C., Nguyen, Q.2026-04-29💻 bioinformatics

Accurate ab initio gene prediction in eukaryotes with Tiberius in multiple clades

L'article présente Tiberius, un prédicteur de gènes ab initio basé sur l'apprentissage profond qui atteint une précision de pointe et des temps d'exécution nettement plus rapides dans divers clades eucaryotes grâce à l'entraînement de modèles spécifiques à chaque lignée, résolvant ainsi efficacement les goulots d'étranglement actuels de l'annotation génomique.

Gabriel, L., Bruna, T., Kaur, A., Krishnan, A., Ortmann, F., Salamov, A., Talbot, S., Becker, F., Krieg, R., Wheat, C. W., Grigoriev, I. V., Stanke, M., Hoff, K. J.2026-04-28💻 bioinformatics

Modeling causal signal propagation in multi-omic factor space with COSMOS

L'article présente COSMOS+, une approche intégrant l'analyse factorielle multi-omiques et des connaissances mécanistiques a priori pour modéliser la propagation causale des signaux et générer des hypothèses interprétables sur les mécanismes de résistance au cancer du sein.

Dugourd, A., Lafrenz, P., Mananes, D., Paton, V., Fallegger, R., Bai, Y., Kroger, A.-C., Turei, D., Li, Y., Trogdon, M., Nager, D., Deng, S., Shen, C., Lapek, J. D., Shtylla, B., Saez-Rodriguez, J.2026-04-24💻 bioinformatics