La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Hierarchical genomic feature annotation with variable-length queries

Ce papier présente HKS, une structure de données basée sur la SBWT qui permet l'annotation exacte et hiérarchique de k-mers de longueur variable sans approximation, en résolvant les ambiguïtés de correspondance multiple et en améliorant la spécificité grâce à un lissage contextuel, tout en offrant des performances comparables aux outils existants.

Alanko, J. N., Ranallo-Benavidez, T. R., Barthel, F. P., Puglisi, S. J., Marchet, C.2026-03-18💻 bioinformatics

HARVEST: Unlocking the Dark Bioactivity Data of Pharmaceutical Patents via Agentic AI

Le papier présente HARVEST, un pipeline d'IA multi-agents capable d'extraire automatiquement des millions de données bioactives « sombres » et auparavant inaccessibles des brevets pharmaceutiques, révélant ainsi des lacunes majeures dans les modèles d'apprentissage actuels et comblant des décennies de travail manuel.

Shepard, V., Musin, A., Chebykina, K., Zeninskaya, N. A., Mistryukova, L., Avchaciov, K., Fedichev, P. O.2026-03-18💻 bioinformatics

PREMISE: A Quality-Aware Probabilistic Framework for Pathogen Resolution and Source Assignment in Viral mNGS

Ce papier présente PREMISE, un cadre probabiliste aligné et optimisé en Rust qui surpasse les méthodes k-mer existantes pour identifier avec précision les souches virales, estimer leurs abondances relatives et détecter les infections mixtes ou les réassortiments dans les données de séquençage métagénomique.

Vijendran, S., Dorman, K., Anderson, T. K., Eulenstein, O.2026-03-18💻 bioinformatics

SpeciefAI: Multi-species mRNA-level Antibody Framework Generation using Transformers

Le papier présente SpeciefAI, un modèle basé sur les transformers capable de générer des régions charpentes (FR) d'anticorps et de nanocorps harmonisées au niveau de l'ARNm pour six espèces différentes, assurant ainsi à la fois une expression efficace et une faible immunogénicité en s'adaptant aux régions déterminantes de complémentarité (CDR) d'entrée.

Grabarczyk, D., Kocikowski, M., Parys, M., Cohen, S. B., Alfaro, J. A.2026-03-18💻 bioinformatics