La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Probabilistic coupling of cellular and microenvironmental heterogeneity by masked self-supervised learning

Le papier présente Mievformer, un cadre d'apprentissage auto-supervisé masqué basé sur les Transformers qui apprend des représentations probabilistes des microenvironnements tissulaires en couplant l'hétérogénéité cellulaire et spatiale, surpassant ainsi les méthodes existantes pour l'analyse des données de transcriptomique spatiale.

Kojima, Y., Tanaka, Y., Hirose, H., Chiwaki, F., Nishimura, K., Hayashi, S., Itahashi, K., Ishikawa, M., Shimamura, T., Mano, H.2026-04-24💻 bioinformatics

Genomic dialects: How amino acid properties and the second codon base shape the informational accents of life

Cette étude propose un cadre de « dialectes génomiques » démontrant que les biais d'utilisation des codons, qui reflètent des « accents informationnels » spécifiques aux espèces, sont principalement façonnés par les propriétés physico-chimiques des acides aminés et la classification du deuxième nucléotide du codon, plutôt que par la phylogénie stricte.

Martinez, O., Ochoa-Alejo, N.2026-04-24💻 bioinformatics

Efficient and scalable modelling of cotranscriptional RNA folding with deterministic and iterative RNA structure sampling

Les auteurs présentent memerna, un cadre de calcul déterministe et itératif permettant un échantillonnage exhaustif et évolutif des structures d'ARN, ce qui améliore considérablement la vitesse et la précision de la modélisation du repliement cotranscriptionnel par rapport aux méthodes stochastiques existantes.

Courtney, E., Choi, E., Ward, M., Lucks, J. B.2026-04-24💻 bioinformatics

Systematic Evaluation of AlphaFold2 and OpenFold3 on Protein-Peptide Complexes

Cette étude présente une évaluation systématique d'AlphaFold2 et OpenFold3 sur des complexes protéine-peptide, révélant la supériorité constante d'AlphaFold2, la nécessité d'adapter les métriques de confiance et les seuils d'évaluation aux spécificités des peptides, et l'impact de la composition séquentielle sur la précision des prédictions.

Fayetorbay, R., Timucin, A. C., Timucin, E.2026-04-24💻 bioinformatics

EpiRanha: Hunting for Epitope Similarity with a Structure- and Residue-Aware Graph Neural Network

EpiRanha est un cadre multimodal innovant qui combine des embeddings de séquence ESM-2 et un réseau de neurones à graphes équivariant pour identifier et classer des épitopes similaires avec une précision supérieure aux méthodes d'alignement rigide, permettant ainsi une évaluation plus robuste des risques de réactivité croisée et une conception d'anticorps plus ciblée.

Francissen, T., Babukhian, M., Britze, H., Wilke, Y., Spreafico, R., Demharter, S., Arts, M.2026-04-23💻 bioinformatics