bioinformatics articles

La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Accurate detection of mosaic mutations at short tandem repeats from bulk sequencing data

Ce papier présente BulkMonSTR, un cadre computationnel combinant une modélisation des erreurs spécifique aux répétitions courtes en tandem (STR) et une classification par apprentissage automatique pour détecter avec précision les mutations mosaïques somatiques dans les données de séquençage de nouvelle génération en vrac, surpassant les méthodes existantes et offrant une base évolutive pour étudier leur rôle dans le vieillissement et les maladies.

Wang, W., Li, W., Wang, C., Fan, W., Xia, Y., Yang, X., Chu, C., Dou, Y.2026-04-01💻 bioinformatics

Explainable protein-protein binding affinity prediction via fine-tuning protein language models

Cette étude présente un cadre évolutif et explicable qui prédit l'affinité de liaison protéine-protéine uniquement à partir des séquences en reformulant le problème comme un apprentissage métrique sur des modèles de langage protéique, surpassant les méthodes basées sur la structure et démontrant une grande efficacité des données et une capacité d'interprétation des résidus clés.

Singh, H., SINGH, R. K., Srivastava, S. P., Pradhan, S., Gorantla, R.2026-04-01💻 bioinformatics

IMMREP25: Unseen Peptides

Le concours IMMREP25 a démontré que l'intégration de la modélisation structurelle permet désormais de prédire avec une précision significative les interactions entre les récepteurs des cellules T et des peptides non vus, marquant une avancée majeure par rapport aux tentatives aléatoires des éditions précédentes.

Richardson, E., Aarts, Y. J. M., Altin, J. A., Baakman, C. A. B., Bradley, P., Chen, B., Clifford, J., Dhar, M., Diepenbroek, D., Fast, E., Gowthaman, R., He, J., Karnaukhov, V., Marzella, D. F., Meys (…)2026-04-01💻 bioinformatics

Inferring circadian phases and quantifying biological desynchrony across single-cell transcriptomes

L'article présente scRitmo, un cadre probabiliste innovant qui infère les phases circadiennes à l'échelle de la cellule unique et quantifie la désynchronisation biologique en séparant le bruit technique de la variabilité réelle dans les données de transcriptomique.

Salati, A., Paychere, Y., Hahaut, V., Gobet, C., Naef, F.2026-04-01💻 bioinformatics

An Integrated Computational-Experimental Strategy For the Prediction of Small Molecules as GLP-1R Agonists

Cette étude présente une stratégie intégrée de criblage virtuel combinant approches ligand et structure pour identifier de nouveaux agonistes du récepteur GLP-1R, révélant notamment le pentapeptide DPDPE comme un candidat prometteur possédant une activité agoniste duale GLP-1R/GIPR.

Murcia Garcia, E., Tian, N., Alonso Fernandez, J. R., Cai, X., Yang, D., Hernandez Morante, J. J., Perez Sanchez, H.2026-04-01💻 bioinformatics

The human pangenome reference reduces ancestry-related biases in somatic mutation detection

Cette étude démontre que l'adoption du génome pangenome humain améliore significativement la détection des mutations somatiques, en réduisant les biais liés à l'ascendance et en augmentant la précision, particulièrement pour les individus d'ascendance asiatique de l'Est.

Pham, C. V. K., Abdelmalek, F. S. A., Hua, T., Apel, E., Bizjak, A., Schmidt, E. J., Houlahan, K. E.2026-04-01💻 bioinformatics

emb2dis: a novel protein disorder prediction tool based on ResNets, dilated convolutions & protein language models

L'article présente emb2dis, un nouvel outil de prédiction du désordre protéique basé sur l'apprentissage profond et les modèles de langage protéique, qui a obtenu la première place dans la catégorie Disorder-PDB du récent défi CAID3 grâce à son architecture innovante combinant réseaux résiduels et convolutions dilatées.

Duarte, S. A., Mehdiabadi, M., Bugnon, L. A., Aspromonte, M. C., Piovesan, D., Milone, D. H., Tosatto, S., Stegmayer, G.2026-04-01💻 bioinformatics

VicMAG, an open-source tool for visualizing circular metagenome-assembled genomes highlighting bacterial virulence and antimicrobial resistance

Le papier présente VicMAG, un outil open-source conçu pour visualiser de manière holistique des génomes métagénomiques assemblés circulaires complexes annotés avec des gènes de virulence, de résistance aux antimicrobiens et des éléments génétiques mobiles, facilitant ainsi la surveillance intégrée des pathogènes bactériens dans divers contextes environnementaux et cliniques.

Tsuda, Y., Tanizawa, Y., Vu, T. M. H., Nishimura, Y., Shintani, M., Abe, H., Hasebe, F., Kasuga, I., Nagao, M., Suzuki, M.2026-04-01💻 bioinformatics

Baktfold: Sensitive protein functional annotation across the microbial tree of life using structural information

Le papier présente Baktfold, un outil logiciel en ligne de commande ultra-sensible et indépendant du taxon qui améliore considérablement l'annotation fonctionnelle des protéines hypothétiques chez les microbes en exploitant des informations structurelles via des modèles de langage protéique et des recherches de structures.

Bouras, G., Lim, S. w., Durr, L., Vreugde, S., Goesmann, A., Edwards, R. A., Schwengers, O.2026-04-01💻 bioinformatics

Protein sequence domain annotation using a language model

Le papier présente PSALM, une nouvelle méthode d'annotation des domaines protéiques qui combine un modèle de langage préentraîné (ESM-2) et un décodeur probabiliste structuré pour atteindre des performances comparables à HMMER tout en offrant une meilleure couverture des séquences à des seuils de confiance plus relâchés.

Sarkar, A., Krishnan, K., Eddy, S. R.2026-03-31💻 bioinformatics

← Précédent Suivant →