La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Multistage Machine Learning Reveals Circadian Gene Programs and Supports a Retina-Choroid Axis in Myopia Development

Cette étude démontre que l'horloge circadienne régit des fenêtres moléculaires critiques dans le développement de la myopie en orchestrant une signalisation coordonnée entre la rétine et la choroïde, dont les signatures génétiques conservées chez l'humain suggèrent l'importance des mécanismes temporels dans la susceptibilité et la progression de la maladie.

Watcharapalakorn, A., Poyomtip, T., Tawonkasiwattanakun, P., Dewi, P. K. K., Thomrongsuwannakij, T., Mahawan, T.2026-04-06💻 bioinformatics

sctrial: Participant-Level Differential Analysis for Longitudinal Single-Cell Experiments

Le papier présente sctrial, un cadre d'analyse open source en Python conçu pour réaliser des tests différentiels au niveau des participants dans les expériences de séquençage ARN de cellules uniques longitudinales, permettant ainsi de corriger les biais de pseudoréplication et d'assurer une quantification rigoureuse de l'incertitude dans les études cliniques et translationnelles.

Vasanthakumari, P., Valencia, I., Aghmiouni, M. R., Magana, B., Omar, M. N.2026-04-06💻 bioinformatics

From nucleotides to semantics: genomic representation learning via joint-embedding predictive architecture

Le papier présente GenoJEPA, un cadre d'apprentissage de représentations génomiques basé sur l'architecture d'encodage conjoint prédictif qui, en remplaçant la reconstruction locale des bases par un alignement sémantique, permet d'obtenir des modèles plus efficaces et généralisables sans nécessiter de finetuning coûteux.

Wang, C., Qi, Q., Sun, H., Zhuang, Z., He, B., Liu, S., Liao, J., Wang, J.2026-04-06💻 bioinformatics

Looplook: An integrative suite for target assignment and functional annotation of chromatin interactions empowered by expression-aware refinement and connected components clustering

Le papier présente Looplook, une suite logicielle intégrative en R qui améliore l'annotation fonctionnelle des interactions chromatiniques en combinant l'analyse topologique par composants connectés avec un raffinement guidé par l'expression génique pour éliminer les faux positifs et reconstruire des réseaux de régulation spatiale de haute confiance.

Zhang, Y., Huang, X., Chen, Y., Xu, L.2026-04-06💻 bioinformatics

Sequence-Driven Drug-Target Affinity Prediction Via Graph Attention Networks and Bidirectional Cross-Attention Fusion

Le modèle XAttn-DTA propose une approche de prédiction de l'affinité médicament-cible basée uniquement sur les séquences, qui combine des réseaux de neurones à attention graphique pour les molécules et des cartes de contact prédites pour les protéines, fusionnées via une attention croisée bidirectionnelle, afin d'atteindre des performances supérieures aux méthodes existantes sans nécessiter de données structurales expérimentales.

Kudari, Z., Kaira, V. S., P, S. S., Bhat, R., Gnana Sekaran, J.2026-04-06💻 bioinformatics

Unravelling genome-wide mosaic microsatellite mutations at single-cell resolution

En développant l'algorithme BayesMonSTR pour détecter les mutations mosaïques des microsatellites à l'échelle du génome entier et à résolution unicellulaire, cette étude révèle une accumulation accrue de ces mutations dans les neurones vieillissants, en particulier au niveau des sites de démarrage de la transcription et des enhancers actifs.

Wang, C., Fan, W., Wang, W., Xia, Y., Lu, J., Ma, X., Yu, J., Zheng, Y., Luo, Y., Li, W., Yang, Q., Lin, M., Liu, H., Lan, Y., Li, C., Liu, X., HE, D., Cai, S., Yu, X., Zhou, D., Kellis, M., Xiong, X. (…)2026-04-05💻 bioinformatics

Widespread data leakage inflates accuracy and corrupts biomarker discovery in cancer drug response prediction

Cette étude révèle que la pratique répandue de la sélection de caractéristiques avant la validation croisée provoque une fuite de données qui fausse systématiquement la précision des modèles de prédiction de réponse aux médicaments anticancéreux et corrompt la découverte de biomarqueurs, un problème présent dans 72 % des méthodes publiées récemment.

Asiaee, A., Strauch, J., Azinfar, L., Pal, S., Pua, H. H., Long, J. P., Coombes, K. R.2026-04-05💻 bioinformatics

Comprehensive characterization of V(D)J recombination from long-read transcriptomic data with VDJcraft

L'article présente VDJcraft, une nouvelle pipeline intégrée conçue pour analyser avec précision la recombinaison V(D)J à partir de données de transcriptomique à lecture longue, permettant ainsi une caractérisation améliorée des signatures immunitaires et la découverte de nouveaux sous-gènes génétiques.

Hu, K., Rosenberg, A. F., Song, Y., Fan, C.-H., Peng, Z., Gao, M., Chong, Z.2026-04-05💻 bioinformatics