La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Evaluation of somatic variant calling methods on high coverage tumour-only amplicon sequencing data in a clinical environment

Cette étude évalue la performance de six outils de détection de variants somatiques intégrés dans un pipeline Snakemake sur des données de séquençage amplicon tumoral-only de référence, révélant que FreeBayes, VarScan, MuTect2 et Pisces offrent les meilleurs résultats bien que FreeBayes génère davantage d'artefacts.

Bharne, D., Gaston, D.2026-04-11💻 bioinformatics

Generative design of intrinsically disordered protein regions with IDiom

Cet article présente IDiom, un modèle de langage protéique autoregressif entraîné sur des millions de séquences de régions désordonnées intrinsèques, capable de générer de nouvelles séquences biologiquement pertinentes et de les optimiser pour une localisation subcellulaire spécifique, comblant ainsi un vide majeur dans la conception rationnelle de ces protéines.

Liu, J., Ibarraran, S., Hu, F., Park, A., Dunn, A., Rotskoff, G.2026-04-11💻 bioinformatics

Structure-Based and Stability-Validated Prioritization of BACE1 Inhibitors Integrating Meta-Ensemble QSAR and Molecular Dynamics

Cette étude présente un cadre computationnel intégré et validé par la stabilité, combinant QSAR méta-ensemble, modélisation par langage protéique et simulations de dynamique moléculaire, pour prioriser et identifier des inhibiteurs prometteurs de BACE1 capables de traverser la barrière hémato-encéphalique dans le traitement de la maladie d'Alzheimer.

Chowdhury, T. D., Shafoyat, M. U., Hemel, N. H., Nizam, D., Sajib, J. H., Toha, T. I., Nyeem, T. A., Farzana, M., Haque, S. R., Hasan, M., Siddiquee, K. N. e. A., Mannoor, K.2026-04-10💻 bioinformatics

TCMCard: A High-Confidence Digital Infrastructure for Traditional Chinese Medicine Quantified by Multi-Dimensional Evidence Integration

Le papier présente TCMCard, une infrastructure numérique de haute confiance pour la médecine traditionnelle chinoise qui intègre des preuves multidimensionnelles pour filtrer le bruit des données et faciliter l'analyse des mécanismes synergiques complexes via une plateforme interactive.

Wang, Y., Dong, W., Yao, J., Wang, K., Zhang, L., Wang, Y., Guo, S., Li, H., Cai, H., Wang, X., Li, Y.2026-04-10💻 bioinformatics

Generating, curating, and evaluating trnL reference sequence databases: Benchmarking OBITools3/ecoPCR, RESCRIPt, and MetaCurator

Cette étude propose une comparaison systématique des outils OBITools3/ecoPCR, RESCRIPt et MetaCurator pour générer et évaluer des bases de données de référence trnL de haute qualité, démontrant que le choix de l'outil optimal dépend de la région trnL spécifique (CD, CH ou GH) tout en fournissant des ressources globales pour le métabarcodage végétal.

KUDDAR, O. S., Meiklejohn, K. A., Callahan, B. J.2026-04-10💻 bioinformatics

Deep learning enables direct HLA typing from immunopeptidomics data

Cet article présente Immunotype, un prédicteur d'apprentissage profond qui détermine directement les allotypes HLA de classe I à partir de données immunopéptidomiques en intégrant des séquences peptidiques et HLA via des encodeurs transformer et un réseau de neurones à graphes, atteignant une précision de 87,2 % pour un typage HLA rapide et économique.

Pilz, M., Scheid, J., Bauer, A., Lemke, S., Sachsenberg, T., Bauer, J., Nelde, A., Stadelmaier, J., Walter, A., Rammensee, H.-G., Nahnsen, S., Kohlbacher, O., Walz, J. S.2026-04-10💻 bioinformatics

Benchmarking ambient RNA removal across droplet and well-plate platforms reveals artificial count generation as a critical failure mode of scAR and CellClear

Cette étude démontre que, bien que CellBender et SoupX offrent une élimination fiable du RNA ambiant avec une intégrité des données préservée, les outils scAR et CellClear génèrent des artefacts critiques et des types cellulaires spurs en reconstruisant artificiellement les matrices de comptage, soulignant ainsi la nécessité d'évaluer l'intégrité des comptes plutôt que la simple sensibilité lors du choix d'un outil de correction.

Schroeder, L., Gerber, S., Ruffini, N.2026-04-10💻 bioinformatics

Statistical Principles Define an Open-Source Differential Analysis Workflow for Mass Spectrometry Imaging Experiments with Complex Designs

Cet article présente un flux de travail d'analyse statistique open-source en R, illustré par une étude de cas sur l'ostéoarthrite, conçu pour détecter les analytes différentiellement abondants dans les expériences d'imagerie par spectrométrie de masse à designs complexes en optimisant le traitement du signal, l'agrégation des caractéristiques et la sélection des régions d'intérêt.

Rogers, E. B. T., Lakkimsetty, S. S., Bemis, K. A., Schurman, C. A., Angel, P. A., Schilling, B., Vitek, O.2026-04-10💻 bioinformatics