La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Benchmarking long-read simulators against Oxford Nanopore whole-genome sequencing data

Cette étude compare six simulateurs de lectures Oxford Nanopore à des données R10.4.1, révélant que, bien que PBSIM3 excelle à reproduire les propriétés générales au niveau des lectures, aucun outil ne capture entièrement les profils d'erreurs complexes des données réelles, ce qui suggère que le choix optimal dépend de la priorité accordée, pour une application donnée, entre le réalisme au niveau des lectures ou les structures d'erreurs spécifiques.

Taouk, M. L., Ingle, D. J., Wick, R. R.2026-05-11💻 bioinformatics

Nanopore event detection in a simple and adaptive way

Cet article présente et valide un algorithme simple, rapide et adaptable de détection d'événements basé sur les clusters (CBED) qui surpasse les schémas existants en termes d'efficacité et de réduction du bruit pour les données de nanopores biologiques, tout en soulignant la nécessité d'une correction de base adaptative pour les données de nanopores solides.

Wei, P., Kansari, M., Mierzejewski, M., Ensslen, T., Lin, C.-Y., Kavetsky, K., Jones, P. D., Behrends, J. C., Drndic, M., Fyta, M.2026-05-11💻 bioinformatics

Investigation of Protein Melting Temperature Prediction with Cross-Method Validation on Biophysical Data

Cette étude présente TmProt 1.0, un modèle d'incorporation ESM-2 affiné qui surpasse les prédicteurs de l'état de l'art existants dans l'identification de protéines thermostables à travers des ensembles de données biophysiques hétérogènes, en répondant au défi critique de la généralisation interdomaine dans la prédiction de la température de fusion des protéines.

Pailozian, K., Kohout, P., Damborsky, J., Mazurenko, S.2026-05-11💻 bioinformatics

The Second Brain: Diffusion Models for Realistic Human Microbiome Generation

Ce papier présente un modèle génératif basé sur la diffusion doté de mécanismes préservant la parcimonie, qui atteint une préservation de la parcimonie au niveau paramétrique et des métriques de distance écologique compétitives pour les données du microbiome humain, représentant la première approche d'apprentissage profond à concilier une telle fidélité de parcimonie tout en restant compétitive sur des référentiels écologiques standards.

Yee, B., Fu, J.2026-05-11💻 bioinformatics

conMItion: an R package adjusting confounding factors for associations in multi-omics

L'article présente conMItion, un package R qui utilise l'information mutuelle conditionnelle pour ajuster de manière robuste les facteurs de confusion tels que la pureté tumorale et la charge mutationnelle dans les analyses d'association multi-omiques, améliorant ainsi la précision de l'identification des gènes et des interactions cellulaires liés au cancer.

Wang, G., Liu, F., Chen, Z., Davoli, T.2026-05-11💻 bioinformatics

Haplotype-resolved diploid genome inference on pangenome graphs

L'article présente DipGenie, un outil évolutif qui optimise conjointement le génotypage et le haplotypage sur des graphes de pan-génome en utilisant un budget de recombinaison motivé biologiquement, atteignant des taux d'erreur de commutation significativement plus faibles et des scores F1 pour les variants structuraux plus élevés que les méthodes existantes basées sur des graphes.

Chandra, G., Doan, W. T., Gibney, D.2026-05-10💻 bioinformatics

Machine learning cross-platform proteomic imputation enables protein quality scoring and replication of epidemiological associations

Cette étude développe un cadre d'apprentissage automatique pour imputer des données protéomiques interplateformes entre SomaScan et Olink, résolvant ainsi les problèmes persistants de non-réplication, permettant la récupération de signaux exclusifs à chaque plateforme et établissant un indice de fidélité des protéines pour améliorer la fiabilité de la découverte de biomarqueurs épidémiologiques.

Li, L., Alaa, A., Tan, Y., Demirel, I., Friedman, S., Zha, Q., Trac, R. P., Taylor, K. D., Yu, B., Ballantyne, C. M., Deo, R., Dubin, R., Tsai, M. Y., Peloso, G. M., Brody, J., Austin, T., Psaty, B. M (…)2026-05-09💻 bioinformatics

Cross Dataset Transcriptomic Analysis Identifies Oxidative Stress Inflammation Gene Networks Modulated by Nutrigenomic Interventions in Parkinson Disease

Cette étude utilise une analyse intégrative transcriptomique inter-ensembles de données pour identifier des gènes centraux liés au stress oxydatif et à l'inflammation dans la maladie de Parkinson et révèle comment des composés bioactifs alimentaires spécifiques peuvent moduler ces réseaux géniques par le biais d'interventions nutrigénomiques.

Rafiee, M., Abaj, F., Mahdevar, M., Rashidian, A., Ghaedi, K., Ghiasvand, R.2026-05-09💻 bioinformatics