La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Correlate: A Web Application for Analyzing Gene Sets and Exploring Gene Dependencies Using CRISPR Screen Data

L'article présente Correlate, une application web gratuite qui permet d'explorer les données de criblage CRISPR du Cancer Dependency Map pour analyser des ensembles de gènes et identifier des dépendances génétiques directement à partir des résultats fonctionnels, offrant ainsi une perspective complémentaire aux approches basées sur les connaissances biologiques préexistantes.

Deolankar, S., Wermeling, F.2026-04-04💻 bioinformatics

snoFlake: A network model for snoRNA-RBP complexes reveals SNORD22 as a U5 snRNP-associated splicing regulator

Cette étude présente snoFlake, un modèle de réseau centré sur les snoARN qui remet en question leur vision canonique en révélant des complexes non canoniques avec des protéines de liaison à l'ARN, et identifie spécifiquement SNORD22 comme un régulateur d'épissage associé au snRNP U5 qui favorise l'inclusion d'exons faibles.

Song, K. S., Cyr, M., Faucher-Giguere, L., Yeo, B., Seow, V. K., Deschamps-Francoeur, G., Abou Elela, S., Scott, M. S.2026-04-04💻 bioinformatics

Structure-Guided Design and Dynamic Evaluation of VP4-Targeting siRNAs Against Rotavirus A

Cette étude présente une approche computationnelle intégrée pour concevoir et évaluer dynamiquement des siARN ciblant la protéine VP4 du rotavirus A, identifiant ainsi un candidat optimisé pour une validation expérimentale en vue de développer de nouvelles thérapies antivirales.

Ahmed, A. N., Satu, K. J., Rahman, A. B. Z. N., Hasan, S. S., Sakib, M. N., Hossan, M. E., Bhattacharjee, A., Chowdhury, Z. M., Joy, Z. F., Islam, M. J., Hossain, M. U.2026-04-04💻 bioinformatics

Improved quantitation in data-independent acquisition proteomics via retention time boundary imputation

Ce papier présente Nettle, un outil open-source qui améliore la quantification en protéomique DIA en imputant les limites de temps de rétention des peptides plutôt que leurs valeurs manquantes, permettant ainsi d'obtenir des résultats plus précis et d'élargir les applications biologiques.

Harris, L. J., Riffle, M., Shulman, N., Fondrie, W. E., Wu, C. C., Johnson Erickson, D. P., Morimoto, A., Shaver, B., Stein, T., Cao, N., Ford, E., Noble, W. S., MacCoss, M. J.2026-04-03💻 bioinformatics

PlantCAD2: a DNA foundation model for interpreting genomes across flowering plants

Le papier présente PlantCAD2, un modèle de langage ADN fondamental spécifique aux plantes à fleurs qui, grâce à son contexte étendu et son entraînement sur 65 génomes, surpasse les modèles existants dans la prédiction de la conservation évolutive et des régulations géniques, offrant ainsi un outil puissant pour l'annotation précise des génomes végétaux.

Zhai, J., Gokaslan, A., Hsu, S.-K., Chen, S.-P., Liu, Z.-Y., Marroquin, E., Czech, E., Cannon, B., Berthel, A., Romay, C., Pennell, M., Kuleshov, V., Buckler, E. S.2026-04-03💻 bioinformatics

PathogenSurveillance: an automated pipeline for population genomic analyses and pathogen identification

Le papier présente PathogenSurveillance, un pipeline Nextflow open-source automatisé conçu pour l'analyse génomique de population et l'identification rapide de pathogènes à partir de données de séquençage d'ADN complet, facilitant ainsi la biosurveillance en temps réel.

Foster, Z. S. L., Sudermann, M. A., Parada Rojas, C. H., Blair, L. K., Iruegas Bocardo, F., Dhakal, U., Alcala-Briseno, R. I., Phan, H., Schummer, T. R., Weisberg, A. J., Chang, J. H., Grunwald, N. J.2026-04-03💻 bioinformatics

CellWHISPER disentangles direct cell-cell communication from structural proximity

CellWHISPER est un cadre statistique novateur qui permet d'inférer avec précision et à grande échelle les communications cellulaires directes à partir de données de transcriptomique spatiale, en distinguant les interactions réelles des simples proximités structurelles et en validant expérimentalement de nouveaux mécanismes de signalisation dans le cerveau et les modèles de maladie d'Alzheimer.

Kumar, A., Moctezuma, F. R., Aggarwal, B., Zhang, N., Coskun, A. F., Sinha, S.2026-04-03💻 bioinformatics

seq2ribo: Structure-aware integration of machine learning and simulation to predict ribosome location profiles from RNA sequences

L'article présente seq2ribo, un cadre hybride combinant simulation et apprentissage automatique qui prédit avec une grande précision les profils de localisation des ribosomes à partir de la seule séquence d'ARNm, permettant ainsi la conception rationnelle de nouvelles séquences sans données expérimentales préalables.

Kaynar, G., Kingsford, C.2026-04-03💻 bioinformatics

Dynamic Consistency Reveals Predictable Genes in Cross-Cell Type Temporal scRNA-Seq Data

En introduisant l'Indice de Cohérence Dynamique (DCI) pour identifier les gènes aux trajectoires temporelles reproductibles à travers différents types cellulaires, cette étude démontre que leur sélection couplée à un modèle de réseau de neurones récurrent incertain améliore significativement la prédiction de l'évolution de l'expression génique après un traumatisme.

Shi, J., Wu, R., Liu, Y., Li, R., Duprey, A.2026-04-03💻 bioinformatics

GATSBI: Improving context-aware protein embeddingsthrough biologically motivated data splits

Ce papier présente GATSBI, un cadre d'incorporation de protéines basé sur l'attention graphique qui, en utilisant des partitions de données biologiquement motivées, améliore significativement la prédiction des interactions et des fonctions, en particulier pour les protéines peu étudiées, surpassant ainsi les méthodes d'incorporation préentraînées existantes.

Nayar, G., Altman, R. B.2026-04-03💻 bioinformatics