bioinformatics articles

La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Bacterial protein function prediction via multimodal deep learning

Les auteurs présentent DeepEST, un cadre d'apprentissage profond multimodal qui améliore la prédiction des fonctions des protéines bactériennes en intégrant l'expression génique, la localisation et la structure protéique pour attribuer des termes d'ontologie des gènes.

Muzio, G., Adamer, M., Fernandez, L., Miklautz, L., Borgwardt, K., Avican, K.2026-02-22💻 bioinformatics

Bias in genome-wide association test statistics due to omitted interactions

Cette étude démontre que l'omission des interactions épistatiques dans les modèles linéaires utilisés pour les études d'association pangénomique (GWAS) peut fausser les statistiques de test en créant un régime anti-conservateur, conduisant ainsi à des signaux de significativité spurieux.

Yelmen, B., Güler, M. N., Estonian Biobank Research Team,, Kollo, T., Möls, M., Charpiat, G., Jay, F.2026-02-22💻 bioinformatics

STELAR-X: Scaling Coalescent-Based Species Tree Inference to 100,000 Species and Beyond

Le papier présente STELAR-X, un algorithme d'inférence phylogénétique basé sur les coalescences et hautement scalable qui, grâce à une refonte des structures de données et à l'utilisation du parallélisme GPU, permet d'analyser des jeux de données contenant jusqu'à 100 000 espèces avec une complexité mémoire optimale et des temps d'exécution considérablement réduits par rapport aux méthodes existantes.

Saha, A., Bayzid, M. S.2026-02-22💻 bioinformatics

Protenix-v1: Toward High-Accuracy Open-Source Biomolecular Structure Prediction

Le papier présente Protenix-v1, le premier modèle open-source de prédiction de structures biomoléculaires surpassant AlphaFold3 en précision tout en respectant les mêmes contraintes de ressources, et offre une version mise à jour entraînée sur des données plus récentes pour soutenir des applications comme la découverte de médicaments.

Zhang, Y., Gong, C., Zhang, H., Ma, W., Liu, Z., Chen, X., Guan, J., Wang, L., Yang, Y., Xia, Y., Xiao, W.2026-02-22💻 bioinformatics

Paired oral clinical specimens reveal the underlying ecology supporting the emergence of inflammophilic microbiome communities

Cette étude démontre que l'inflammation hôte agit comme une pression sélective restructurant le microbiome oral vers des communautés inflammophiles métaboliquement adaptées, passant d'un état anabolique centré sur les glucides à un état catabolique favorisant la fermentation d'acides aminés et la résistance aux antimicrobiens.

Krieger, M., Kerns, K. A., Palmer, E. A., McLean, J. S., Kreth, J., Yardimci, G. G., Merritt, J.2026-02-21💻 bioinformatics

Disentangling the Impacts of Incomplete Lineage Sorting and Gene Tree Estimation Error on Species Tree Inference

Cette étude démontre que, à niveaux de discordance équivalents, l'erreur d'estimation des arbres de gènes (GTEE) affecte davantage l'inférence de l'arbre des espèces que l'hybridation incomplète des lignées (ILS), car elle génère un bruit plus uniforme et moins structuré dans les distributions de quarts.

Tahmid, N., Rhythm, S. I., Bayzid, M. S.2026-02-21💻 bioinformatics

Structural motif search across the protein-universe with Folddisco

Les auteurs présentent Folddisco, un outil logiciel libre qui permet une recherche rapide, précise et économe en stockage de motifs structuraux protéiques dans une base de données massive de 53 millions de structures grâce à un index géométrique innovant.

Kim, H., Kim, R. S., Mirdita, M., Yoon, J., Steinegger, M.2026-02-20💻 bioinformatics

On Deriving Synteny Blocks by Compacting Elements

Cet article propose un cadre formel et un algorithme linéaire pour dériver des blocs de synténie directement à partir de données de séquences en évitant les points de cassure, résolvant ainsi efficacement des problèmes d'optimisation autrement NP-difficiles pour mieux étudier les réarrangements génomiques.

Bohnenkaemper, L., Parmigiani, L., Chauve, C., Stoye, J.2026-02-20💻 bioinformatics

ProteoMapper: Alignment-Aware Identification and Quantitative Analysis of Contextual Motif-Domain Patterns in Protein Families

ProteoMapper est un cadre computationnel qui intègre l'annotation des domaines et la détection de motifs pour quantifier leurs relations spatiales au sein des familles de protéines, permettant ainsi une analyse évolutive et fonctionnelle précise sans nécessiter de compétences en programmation.

Sefa, S. M., Sarkar, J., Robin, A. H. K., Uddin, M.2026-02-20💻 bioinformatics

A New Sparse Bayesian Quantile Neural Network-based Approach and Its Application to Discover Physiological Sweet Spots in the Canadian Longitudinal Study on Aging

En s'appuyant sur les données de l'Étude longitudinale canadienne sur le vieillissement, cette étude propose une nouvelle approche d'apprentissage profond bayésien sparse, le Q-FSNet et le Q-DirichNet, pour identifier 25 métabolites présentant des « points optimaux » physiologiques qui minimisent l'accélération de l'âge biologique, offrant ainsi un outil interprétable pour la médecine de précision.

Min, J., Vishnyakova, O., Brooks-Wilson, A., Elliott, L. T.2026-02-20💻 bioinformatics

← Précédent Suivant →