La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

CROWN: Curated Repository Of Well-resolved Noncovalent interactions

Cet article présente CROWN, un nouveau jeu de données de 153 005 complexes protéine-ligand généré par un pipeline automatisé de filtrage et de minimisation d'énergie, qui offre une diversité structurelle quatre fois supérieure à celle des bases existantes tout en conservant des normes de qualité rigoureuses pour l'entraînement de modèles d'apprentissage automatique.

Poelmans, R., Van Eynde, W., Bruncsics, B., Bruncsics, B., Arany, A., Moreau, Y., Voet, A. R.2026-04-01💻 bioinformatics

geneslator: an R package for comprehensive gene identifier conversion and annotation

Le package R geneslator offre un cadre unifié et précis pour la conversion d'identifiants géniques, la cartographie des orthologues et l'annotation des voies biologiques chez huit organismes modèles, permettant ainsi une interprétation robuste et reproductible des données de séquençage à haut débit.

Cavallaro, G., Micale, G., Privitera, G. F., Pulvirenti, A., Forte, S., Alaimo, S.2026-04-01💻 bioinformatics

T-Rex: Standardized Analysis of Germline Variants in Whole-Exome Sequencing Trios

T-Rex est une application de bureau intuitive et sans code qui permet aux cliniciens d'analyser de manière standardisée et conforme aux réglementations les données de séquençage de l'exome entier en trio pour identifier des variants germinaux rares, en intégrant des outils de pointe et en démontrant une haute précision et une validation clinique robuste.

Reh, S.-L., Walter, C., Lohse, J., Ghete, T., Metzler, M., Quante, A., Hauer, J., Auer, F.2026-04-01💻 bioinformatics

STAPLE: automating spatial transcriptomics analysis and AI interpretation

STAPLE est un cadre modulaire qui automatise et unifie l'analyse des transcriptomies spatiales en intégrant des outils disparates et en générant des rapports interprétables par l'intelligence artificielle pour améliorer la reproductibilité et l'interprétation des résultats biologiques.

Lvovs, D., Quinn, J., Forjaz, A., Santana-Cruz, I., Stapleton, O., Vavikolanu, K., Wetzel, M., Data Science Hub TeamLab,, Demystifying Pancreatic Cancer Therapies TeamLab,, Pagan, V. B., Herb, B. R. (…)2026-04-01💻 bioinformatics

Dynamic multimodal survival prediction in multiple myeloma integrating gene expression, longitudinal laboratories, and treatment history

Cette étude présente un cadre multimodal dynamique intégrant l'expression génique, les trajectoires de laboratoire longitudinales et l'historique des traitements pour prédire la survie globale des patients atteints de myélome multiple avec une précision supérieure aux méthodes existantes, tout en validant sa robustesse sur des cohortes indépendantes et en identifiant des signatures biologiques pertinentes.

JIA, S., Lysenko, A., Boroevich, K. A., Sharma, A., Tsunoda, T.2026-04-01💻 bioinformatics

Robust Random Forests for Genomic Prediction: Challenges and Remedies

Cette étude propose un cadre robuste pour les forêts aléatoires en génomique, démontrant que les stratégies de transformation des données, notamment les approches basées sur le classement, constituent la méthode la plus efficace pour atténuer les effets de la contamination des données tout en préservant la qualité des prédictions pour la sélection animale et végétale.

Lourenco, V. M., Ogutu, J. O., Piepho, H.-P.2026-04-01💻 bioinformatics

SSPSPredictor: A Sequence and Structure based Deep Learning Model for Predicting Phase-Separating Proteins

Ce papier présente SSPSPredictor, un modèle d'apprentissage profond multimodal fusionnant des informations de séquence et de structure pour prédire avec précision et interprétabilité les protéines subissant une séparation de phases, révélant ainsi des liens significatifs entre les protéines intrinsèquement désordonnées, les mutations pathogènes et les maladies.

Wang, T., Liao, S., Qi, Y., Zhang, Z.2026-04-01💻 bioinformatics

Accurate detection of mosaic mutations at short tandem repeats from bulk sequencing data

Ce papier présente BulkMonSTR, un cadre computationnel combinant une modélisation des erreurs spécifique aux répétitions courtes en tandem (STR) et une classification par apprentissage automatique pour détecter avec précision les mutations mosaïques somatiques dans les données de séquençage de nouvelle génération en vrac, surpassant les méthodes existantes et offrant une base évolutive pour étudier leur rôle dans le vieillissement et les maladies.

Wang, W., Li, W., Wang, C., Fan, W., Xia, Y., Yang, X., Chu, C., Dou, Y.2026-04-01💻 bioinformatics