La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Efficient Stochastic Trace Generation for Transcription

Ce papier présente **bcrnnoise**, un framework Python open-source qui unifie la dérive déterministe, les fluctuations gaussiennes et les sauts sporadiques additifs dans un modèle unique d'équation différentielle stochastique pour générer efficacement des traces de transcription précises avec une vitesse de calcul jusqu'à deux ordres de grandeur supérieure à l'échantillonnage stochastique exact.

Ferdowsi, A., Fuegger, M., Nowak, T.2026-05-08💻 bioinformatics

SaVanache: indexing and visualizing pangenome variation graphs

SaVanache est un outil de visualisation multi-résolution qui permet une exploration efficace en temps réel et une comparaison intuitive d'un à plusieurs des graphes de variation de pangenome complexes en prétraitant les fichiers GFA pour créer des index optimisés et en utilisant des glyphes spécialisés pour mettre en évidence les variations structurelles par rapport à un génome pivot linéaire.

Mohamed, M., Durant, E., Rouard, M., Muller, C., Monat, C., Conte, M., Sabot, F.2026-05-08💻 bioinformatics

Striping artifact removal in VisiumHD data through nuclear counts modeling

Ce papier présente une méthode statistique de destriping pour les données VisiumHD de 10x Genomics qui modélise les comptes de bins en utilisant la segmentation des noyaux et un modèle linéaire généralisé régularisé pour éliminer efficacement les artefacts de rayures multiplicatifs tout en préservant les signaux biologiques à grande échelle, surpassant ainsi les approches de normalisation existantes.

Malsot, P., Londschien, M., Boeva, V., Raetsch, G.2026-05-07💻 bioinformatics

SLiMNet: a deep learning model to detect short linear motifs using protein large language model representations and paired inputs

L'article présente SLiMNet, un modèle d'apprentissage profond exploitant les embeddings de modèles de langage à grande échelle pour les protéines et l'apprentissage contrastif afin de prédire les similitudes fonctionnelles entre les motifs linéaires courts (SLiMs), permettant ainsi l'annotation fonctionnelle de motifs précédemment non caractérisés et fournissant des atlas complets de paires fonctionnelles potentielles pour la communauté scientifique.

McFee, M. C., Kim, P. M.2026-05-07💻 bioinformatics

ProtSpace: Protein Universe in Your Browser

ProtSpace est une application web basée sur le navigateur, respectueuse de la vie privée, qui permet la visualisation interactive et l'exploration systématique des espaces d'incorporation de modèles de langage de protéines, révélant des relations fonctionnelles et structurelles complexes au-delà de la similarité de séquence traditionnelle grâce à une visualisation intégrée de structures 3D et à des annotations multi-étiquettes.

Senoner, T., Vahidi, P., Olenyi, T., Senoner, F., Sisman, G., Kahl, E., Rost, B., Koludarov, I.2026-05-07💻 bioinformatics

Beyond Pathway Boundaries: A Degree-Aware Network Clustering Test for Gene Sets

L'article présente MANGO, une nouvelle méthode de regroupement de réseaux qui corrige le biais des nœuds centraux dans l'analyse des ensembles de gènes en conditionnant sur la distribution des degrés, permettant ainsi une détection robuste de l'autocorrélation spatiale biologiquement significative sans les faux positifs inhérents aux approches traditionnelles de sur-représentation ou aux approches naïves basées sur les réseaux.

Queme, B., Marjoram, P., Mi, H.2026-05-07💻 bioinformatics

Simple baselines rival protein language models in mutation-dense design tasks

Cet article démontre que les méthodes de référence conventionnelles se comportent aussi bien, voire mieux, que les modèles de langage protéique dans la prédiction des effets des variants protéiques à forte densité de mutations, ce qui suggère que les pLM nécessitent une intégration avec des a priori biophysiques ou structuraux pour faire progresser efficacement la conception de protéines.

Talpir, I., Fleishman, S. J.2026-05-06💻 bioinformatics

PhenotypeToGeneDownloaderR: automated multi-source retrieval and validation of phenotype-associated genes

PhenotypeToGeneDownloaderR est un pipeline léger et reproductible en R/Python qui automatise la récupération, l'harmonisation et la validation des gènes associés aux phénotypes à partir de multiples bases de données biologiques hétérogènes, atteignant un rappel élevé et démontrant la complémentarité des sources de preuves intégrées pour l'analyse génétique en aval.

Muneeb, M., Ascher, D. B.2026-05-06💻 bioinformatics