bioinformatics articles

La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

RNAElectra: An ELECTRA-Style RNA Foundation Model for RNA Regulatory Inference

Ce papier présente RNAElectra, un modèle de fondation pour l'ARN préentraîné selon une approche ELECTRA avec détection de tokens remplacés (RTD) plutôt qu'un masquage classique, ce qui lui permet de surpasser les modèles existants dans la prédiction de diverses régulations et interactions de l'ARN tout en offrant une meilleure interprétabilité.

Ding, K., Liu, L., Parker, B., Wen, J.2026-03-17💻 bioinformatics

Learning Universal Representations of Intermolecular Interactions with ATOMICA

Ce papier présente ATOMICA, un modèle d'apprentissage profond géométrique capable d'acquérir des représentations universelles des interfaces intermoléculaires à travers cinq modalités biologiques, surpassant les méthodes existantes sur plusieurs tâches de prédiction et permettant d'identifier expérimentalement de nouveaux ligands pour des protéines au fonction inconnue.

Fang, A., Desgagne, M., Zhang, Z., Zhou, A., Loscalzo, J., Pentelute, B. L., Zitnik, M.2026-03-16💻 bioinformatics

Metagenomic-scale analysis of the predicted protein structure universe

En combinant les bases de données AlphaFold et ESMatlas pour créer l'ensemble de données AFESM de 820 millions de structures, cette étude révèle une diversité structurelle inédite, notamment 12 nouveaux repliements de domaines et 11 941 combinaisons jamais observées, soulignant l'importance cruciale des données métagénomiques et de la qualité des prédictions pour explorer l'univers des protéines.

Yeo, J., Han, Y., Bordin, N., Lau, A. M., Kandathil, S. M., Kim, H., Levy Karin, E., Mirdita, M., Jones, D. T., Orengo, C., Steinegger, M.2026-03-16💻 bioinformatics

BiOS: An Open-Source Framework for the Integration of Heterogeneous Biodiversity Data

Le Biodiversity Observatory System (BiOS) est une plateforme logicielle open-source modulaire qui, en respectant les principes FAIR et en séparant la gestion des données de leur visualisation, permet d'intégrer et d'harmoniser des données de biodiversité hétérogènes pour faciliter la recherche et la conservation.

Roldan, A., Duran, T. G., Far, A. J., Capa, M., Arboleda, E., Cancellario, T.2026-03-16💻 bioinformatics

SC-BIG: A Hierarchical Bayesian Model for Bulk-Informed Single Nucleotide Variant Calling in Single Cells

Le papier présente SC-BIG, un modèle bayésien hiérarchique qui améliore la détection des variants nucléotidiques somatiques dans les cellules uniques en exploitant les données de séquençage de masse pour estimer les fractions cellulaires cancéreuses et fournir des probabilités postérieures bien calibrées.

Schuette, D., Kono, T. J. Y., Schwarz, R. F.2026-03-16💻 bioinformatics

An explanatory benchmark of spatial domain detection reveals key drivers of method performance

Cette étude présente un benchmark explicatif de 26 méthodes de détection de domaines spatiaux sur un large éventail de données réelles et semi-synthétiques, révélant que la résolution et l'hétérogénéité cellulaire sont des facteurs déterminants de la performance et démontrant que le choix du prétraitement et du clustering influence davantage les résultats que l'innovation architecturale des modèles.

Descoeudres, A., Prusina, T., Schmidt, N., Do, V. H., Mages, S., Klughammer, J., Matijevic, D., Canzar, S.2026-03-16💻 bioinformatics

High-Fidelity Long-term Whole-embryo Lineage and Fate Reconstruction by Iterative Tracking with Error Correction

Cet article présente ITEC, une méthode entièrement non supervisée permettant de reconstruire avec une haute fidélité les lignées cellulaires complètes et les cartes de destin d'embryons entiers à travers plusieurs espèces, offrant ainsi une plateforme puissante pour l'exploration systématique de la dynamique du développement à l'échelle cellulaire.

Wang, M., Zhang, Q., Wang, C., Chi, Y., Zheng, W., Mu, Z., Cao, X., Zhang, W., Yang, B., Schier, A. F., Acedo, J. N., Wan, Y., Yu, G.2026-03-16💻 bioinformatics

Integrative modeling of read depth and B-allele frequency improves single-cell copy number calling from targeted DNA sequencing panels

Les auteurs présentent scPloidyR, un modèle statistique qui améliore considérablement la détection des variations du nombre de copies dans les cellules uniques à partir de panels de séquençage ciblés en intégrant conjointement la profondeur de lecture et la fréquence allélique B, surpassant les méthodes existantes lorsque des informations alléliques sont disponibles.

Pei, D., Griffard-Smith, R., Cano Urrego, B., Schueddig, E.2026-03-16💻 bioinformatics

Reinforcement Learning for Antibiotic Stewardship: Optimizing Prescribing Policies Under Antimicrobial Resistance Dynamics

Cette étude présente un cadre de simulation pour évaluer des politiques de prescription d'antibiotiques via l'apprentissage par renforcement, démontrant que les approches hiérarchiques surmontent efficacement les défis de l'observabilité partielle et des retards de feedback pour optimiser la gestion de la résistance aux antimicrobiens.

Lee, J., Blumberg, S.2026-03-16💻 bioinformatics

Reliable Molecular Retrieval from Mass Spectra using Conformal Prediction

Cette étude applique la prédiction conforme à la recherche moléculaire par spectrométrie de masse pour générer des ensembles de candidats fiables et spécifiques à chaque spectre, garantissant une couverture statistique contrôlée même en présence de décalages de distribution.

Rakhshaninejad, M., De Waele, G., Jürgens, M., Waegeman, W.2026-03-16💻 bioinformatics

← Précédent Suivant →