bioinformatics articles

La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Benchmarking circRNA Detection Tools from Long-Read Sequencing Using Data-Driven and Flexible Simulation Framework

Cette étude présente le premier benchmark comparatif de trois outils de détection de circARN à partir de données de séquençage long-read Oxford Nanopore, en s'appuyant sur un cadre de simulation flexible et open-source développé par les auteurs pour évaluer leurs performances et souligner la nécessité de combiner plusieurs approches pour une détection plus précise.

Rusakovich, A., CORRE, S., Cadieu, E., Fraboulet, R.-M., Le Bars, V., Galibert, M.-D., Derrien, T., Blum, Y.2026-03-06💻 bioinformatics

Joint Learning of Drug-Drug Combination and Drug-DrugInteraction via Coupled Tensor-Tensor Factorization with SideInformation

Cet article propose un cadre d'apprentissage conjoint basé sur la factorisation de tenseurs couplés et l'intégration d'informations auxiliaires pour prédire simultanément les combinaisons de médicaments efficaces et leurs interactions, démontrant une performance supérieure, notamment dans le contexte de la prédiction pour de nouveaux médicaments.

Zhang, X., Fang, Z., Tang, K., Chen, H., Li, J.2026-03-06💻 bioinformatics

t2pmhc: A Structure-Informed Graph Neural Network to predict TCR-pMHC Binding

Le modèle t2pmhc, une architecture de réseau de neurones à base de graphes exploitant les structures 3D prédites des complexes TCR-pMHC, surpasse les méthodes séquentielles existantes en améliorant la généralisation aux peptides non vus et en identifiant des motifs d'attention biologiquement pertinents pour la conception de vaccins et d'immunothérapies.

Polster, M., Stadelmaier, J., Ball, E., Scheid, J., Bauer, J., Nelde, A., Claassen, M., Dubbelaar, M. L., Walz, J. S., Nahnsen, S.2026-03-06💻 bioinformatics

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

Ce papier présente RigidSSL, un cadre d'apprentissage auto-supervisé géométrique qui intègre la rigidité et les dynamiques conformationnelles pour améliorer significativement la conception de protéines et la modélisation de leurs ensembles conformationnels.

Ni, Z., Li, Y., Qiu, Z., Schölkopf, B., Guo, H., Liu, W., Liu, S.2026-03-06💻 bioinformatics

ProtNHF: Neural Hamiltonian Flows for Controllable Protein Sequence Generation

Le papier présente ProtNHF, un modèle génératif basé sur des flots hamiltoniens neuronaux qui permet un contrôle continu et programmable des propriétés des séquences protéiques au moment de l'inférence via des fonctions de biais analytiques, sans nécessiter de réentraînement du modèle.

Raghavan, B., Rogers, D. M.2026-03-06💻 bioinformatics

Single-Cell Genomics Decontamination with CellSweep

Le papier présente CellSweep, un outil efficace et performant conçu pour éliminer les contaminations ambiantes et globales dans les données de génomique à cellule unique, surpassant ainsi les méthodes existantes pour garantir des analyses plus fiables.

Caskey, M., Rich, J., Weber, R., Mortazavi, A., Pachter, L., Hallgrimsdottir, I. B.2026-03-06💻 bioinformatics

Using Variable Window Sizes for Phylogenomic Analyses of Whole Genome Alignments

Cette étude propose une méthode d'analyse phylogénomique utilisant des tailles de fenêtres variables via une stratégie de division et de fusion pour mieux capturer la variation des taux de recombinaison, surpassant ainsi les approches à fenêtre fixe sur des données simulées et appliquées aux genomes de papillons Heliconius et de grands singes.

Ivan, J., Lanfear, R.2026-03-06💻 bioinformatics

Reliable prediction of short linear motifs in the human proteome

Cet article présente SLiMMine, une méthode basée sur l'apprentissage profond qui améliore la prédiction fiable des motifs linéaires courts (SLiMs) dans le protéome humain en réduisant considérablement les faux positifs et en facilitant la découverte de nouvelles interactions protéiques.

Pancsa, R., Ficho, E., Kalman, Z. E., Gerdan, C., Remenyi, I., Zeke, A., Tusnady, G. E., Dobson, L.2026-03-06💻 bioinformatics

A latent space thermodynamic model of cell differentiation

Ce papier présente le modèle LSD, un cadre thermodynamique inspiré qui utilise des équations différentielles ordinaires neuronales pour reconstruire les trajectoires de différenciation cellulaire dans un espace latent, permettant ainsi de prédire les destins cellulaires et de quantifier la plasticité avec une précision supérieure aux méthodes existantes.

Poursina, A., Hajhashemi, S., Mikaeili Namini, A., Saberi, A., Emad, A., Najafabadi, H. S.2026-03-06💻 bioinformatics

RNA-seq analysis in seconds using GPUs

Les auteurs présentent une implémentation GPU de kallisto pour la quantification des transcrits en RNA-seq, qui, grâce à une refonte algorithmique adaptée au parallélisme massif, offre un gain de vitesse de 30 à 50 fois par rapport à la version CPU multithreadée, permettant l'analyse de grands ensembles de données en quelques secondes.

Melsted, P., Guthnyjarson, E. M., Nordal, J.2026-03-06💻 bioinformatics

← Précédent Suivant →