La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

MoCoO: Momentum Contrast ODE-Regularized VAE for Single-Cell Trajectory Inference and Representation Learning

L'article présente MoCoO, un cadre modulaire intégrant un autoencodeur variationnel, des équations différentielles neuronales et un contraste par momentum, qui, complété par un affinage par flux de matching, permet d'inférer avec une grande précision les trajectoires de différenciation cellulaire et d'apprendre des représentations robustes à partir de données de séquençage ARN de cellules uniques.

Fu, Z.2026-03-31💻 bioinformatics

Structured Pooling Improves Detection of Rare Regulatory Mutations in Population-Scale Reporter Assays

Cette étude présente une approche innovante combinant un design expérimental de pools structurés et un modèle bayésien pour améliorer la détection précise de mutations régulatrices rares à l'échelle du génome entier dans des essais rapporteurs de population.

Dura, K., Siklenka, K., Strouse, K. P., Morrow, S., Zhang, C., Barrera, A., Allen, A. S., Reddy, T. E., Majoros, W. H.2026-03-31💻 bioinformatics

Cell type composition drives patient stratification in single-cell RNA-seq cohorts

En évaluant onze cohortes de séquençage ARN monocellulaire, cette étude démontre que la composition des types cellulaires, notamment via des proportions transformées en log-ratio centré, constitue une méthode simple, robuste et interprétable surpassant les approches complexes pour la stratification des patients, et propose à cet effet l'outil open-source scECODA.

Halter, C., Andreatta, M., Carmona, S.2026-03-31💻 bioinformatics

Protein Language Model Decoys for Target Decoy Competition in Proteomics: Quality Assessment and Benchmarks

Cette étude évalue l'utilisation de modèles de langage protéique pour générer des séquences leurres en protéomique et conclut que, bien qu'ils réduisent les artefacts séquentiels, ils ne surpassent pas encore les méthodes classiques de réversion, servant davantage d'outils de diagnostic et de test de stress que de remplacement universel.

Reznikov, G., Kusters, F., Mohammadi, M., van den Toorn, H. W. P., Sinitcyn, P.2026-03-31💻 bioinformatics

Pan-Metabolomics Repository Mapping of the Carnitine Landscape

En exploitant une stratégie de fouille de données pan-référentielle sur des spectres LC-MS/MS, cette étude a généré une bibliothèque exhaustive de 34 222 spectres MS/MS pour 2 857 compositions atomiques, permettant ainsi de cartographier la diversité chimique des carnitines et d'identifier de nouvelles conjugaisons, comme celles avec l'acide dihydroférulique, pour mieux comprendre leur rôle dans le métabolisme, le régime alimentaire et l'exposition aux xénobiotiques.

Mannochio-Russo, H., Ferreira, P. C., Kvitne, K. E., Patan, A., Deleray, V., Agongo, J., Gouda, H., Goncalves Nunes, W. D., Xing, S., Zemlin, J., van Faassen, M., Reilly, E. R., Koo, I., Patterson, A. (…)2026-03-31💻 bioinformatics

Carafe2 enables high quality in silico spectral library generation for timsTOF data-independent acquisition proteomics

L'article présente Carafe2, un outil de deep learning capable de générer des bibliothèques spectrales in silico de haute qualité directement à partir de données DIA natives timsTOF, surpassant les modèles préentraînés sur des données DDA pour améliorer la détection et la quantification des peptides dans diverses applications protéomiques.

Wen, B., Paez, J. S., Hsu, C., Canzani, D., Chang, A. T., Shulman, N., MacLean, B. X., Berg, M. D., Villen, J., Fondrie, W., Pino, L., MacCoss, M. J., Noble, W. S.2026-03-31💻 bioinformatics

Scalable Microbiome Network Inference: Mitigating Sparsity and Computational Bottlenecks in Random Effects Models

Cet article présente Parallel-REM, un pipeline Python parallèle et évolutif qui surmonte les goulots d'étranglement computationnels des modèles à effets aléatoires pour l'inférence de réseaux microbiens, permettant un traitement rapide de données massives avec une précision statistique préservée pour alimenter les architectures d'apprentissage profond.

Roy, D., Ghosh, T. S.2026-03-31💻 bioinformatics