La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

A Convolutional Deep Learning Approach to identify DNA Sequences for Gene Prediction

Cet article présente une méthode d'apprentissage automatique basée sur un réseau de neurones convolutif (CNN) et la vectorisation TFxIDF appliquée à des séquences d'acides aminées dérivées du génome humain GRCh38, permettant d'identifier avec une grande précision les séquences codant pour des gènes et atteignant ainsi l'état de l'art en matière de prédiction génique.

Motta, J. A., Gomez, P. D.2026-04-01💻 bioinformatics

Adaptive Cluster-Count Autoencoders with Dirichlet Process Priors for Geometry-Aware Single-Cell Representation Learning

Cette étude présente des autoencodeurs adaptatifs intégrant un processus de Dirichlet pour apprendre des représentations de cellules uniques optimisées pour la géométrie du manifold et la visualisation, révélant un compromis où l'amélioration de la structure des clusters s'accompagne d'une légère baisse de la précision des étiquettes, définissant ainsi des régimes d'utilisation spécifiques selon la tâche biologique visée.

Fu, Z.2026-04-01💻 bioinformatics

Simplex-Constrained Neural Topic VAEs with Flow Refinement for Interpretable Single-Cell Gene-Program Discovery

Le papier présente Topic-FM, une famille de VAEs à thème neuronal qui contraint l'espace latent au simplexe de probabilité et utilise un champ de flux de transport optimal conditionnel pour améliorer simultanément l'interprétabilité biologique des programmes géniques et les performances de clustering sur des données de transcriptomique à cellule unique.

Fu, Z.2026-04-01💻 bioinformatics

Serum metabolic signatures of cognitive resilience in a longitudinal aging cohort

Cette étude longitudinale identifie des signatures métaboliques sériques spécifiques, notamment des carnitines, des dérivés alimentaires comme la pipérine et des métabolites de médicaments, qui sont associées à la résilience cognitive au cours du vieillissement.

Scheurink, T. A. W., Seo, J. I., David, L. C., Wang, C. X., Solis, D., Zemlin, J., Bergstrom, J., Dorrestein, P. C., Mohanty, I., Molina, A. J. A.2026-04-01💻 bioinformatics

Subcellular Localization Constrains Protein Detectability and Reveals Systematic RNA-Protein Discordance Across Cancers

Cette étude démontre que l'intégration de la localisation subcellulaire dans un cadre d'apprentissage automatique améliore considérablement la prédiction de la détectabilité des protéines par rapport aux niveaux d'ARNm, révélant ainsi une discordance systématique et biologiquement structurée entre l'expression génique et protéique dans divers cancers.

Joshi, K., Kate, S.2026-04-01💻 bioinformatics

CROWN: Curated Repository Of Well-resolved Noncovalent interactions

Cet article présente CROWN, un nouveau jeu de données de 153 005 complexes protéine-ligand généré par un pipeline automatisé de filtrage et de minimisation d'énergie, qui offre une diversité structurelle quatre fois supérieure à celle des bases existantes tout en conservant des normes de qualité rigoureuses pour l'entraînement de modèles d'apprentissage automatique.

Poelmans, R., Van Eynde, W., Bruncsics, B., Bruncsics, B., Arany, A., Moreau, Y., Voet, A. R.2026-04-01💻 bioinformatics

Robust Random Forests for Genomic Prediction: Challenges and Remedies

Cette étude propose un cadre robuste pour les forêts aléatoires en génomique, démontrant que les stratégies de transformation des données, notamment les approches basées sur le classement, constituent la méthode la plus efficace pour atténuer les effets de la contamination des données tout en préservant la qualité des prédictions pour la sélection animale et végétale.

Lourenco, V. M., Ogutu, J. O., Piepho, H.-P.2026-04-01💻 bioinformatics