bioinformatics articles

La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Genomic-island cassette architecture drives pathogenic Enterococcus cecorum lineages: Cassette2Vec-EC, a structural genomics and machine-learning framework

Cet article présente Cassette2Vec-EC, un cadre intégrant la génomique structurelle et l'apprentissage automatique qui modélise l'architecture des îlots génétiques d'Enterococcus cecorum sous forme de modules transférables pour prédire avec précision les lignées pathogènes et identifier des cibles de surveillance spécifiques.

Goswami, A., Rafi, S., Lagad, R.2026-02-21💻 bioinformatics

Structural motif search across the protein-universe with Folddisco

Les auteurs présentent Folddisco, un outil logiciel libre qui permet une recherche rapide, précise et économe en stockage de motifs structuraux protéiques dans une base de données massive de 53 millions de structures grâce à un index géométrique innovant.

Kim, H., Kim, R. S., Mirdita, M., Yoon, J., Steinegger, M.2026-02-20💻 bioinformatics

On Deriving Synteny Blocks by Compacting Elements

Cet article propose un cadre formel et un algorithme linéaire pour dériver des blocs de synténie directement à partir de données de séquences en évitant les points de cassure, résolvant ainsi efficacement des problèmes d'optimisation autrement NP-difficiles pour mieux étudier les réarrangements génomiques.

Bohnenkaemper, L., Parmigiani, L., Chauve, C., Stoye, J.2026-02-20💻 bioinformatics

AptaBLE: A Deep Learning Platform for Aptamer Generation and Analysis

Le papier présente AptaBLE, une plateforme d'apprentissage profond qui prédit la liaison des aptamères aux protéines et génère de nouveaux aptamères avec une haute spécificité et une affinité élevée, offrant ainsi une avancée majeure pour leur développement thérapeutique et diagnostique.

Patel, S., Fraser, K., Gandavadi, D., Dwivedy, A., Wang, X., Peng, F. Z., Chatterjee, P., Yao, S.2026-02-20💻 bioinformatics

Embarrassingly_FASTA: Enabling Recomputable, Population-Scale Pangenomics by Reducing Commercial Genome Processing Costs from $100 to less than $1

Le papier présente Embarrassingly_FASTA, un pipeline accéléré par GPU qui réduit drastiquement le coût et le temps de traitement des génomes, rendant économiquement viable le stockage des données brutes et la réanalyse à grande échelle pour des études de pangenomes populationnelles.

Walsh, D. J., Njie, e. G.2026-02-20💻 bioinformatics

ProteoMapper: Alignment-Aware Identification and Quantitative Analysis of Contextual Motif-Domain Patterns in Protein Families

ProteoMapper est un cadre computationnel qui intègre l'annotation des domaines et la détection de motifs pour quantifier leurs relations spatiales au sein des familles de protéines, permettant ainsi une analyse évolutive et fonctionnelle précise sans nécessiter de compétences en programmation.

Sefa, S. M., Sarkar, J., Robin, A. H. K., Uddin, M.2026-02-20💻 bioinformatics

Geometric-aware and interpretable deep learning for single-cell batch correction via explicit disentanglement and optimal transport

L'article présente iDLC, un cadre d'apprentissage profond interprétable qui corrige efficacement les effets de lot dans les données de séquençage ARN de cellules uniques en séparant explicitement les composantes biologiques et techniques via un désentanglement de caractéristiques et un alignement de distributions régularisé par le transport optimal, tout en préservant la fidélité biologique et en s'adaptant à des jeux de données à grande échelle.

Jiang, C., Zheng, R., Ji, Y., Cao, S., Fang, Y., Wang, Z., Wang, R., Liang, S., Tao, S.2026-02-20💻 bioinformatics

TSUMUGI: a platform for phenotype-driven gene network identification from comprehensive knockout mouse phenotyping data

TSUMUGI est une plateforme qui exploite les données de phénotypage systématique de souris knock-out de l'IMPC pour identifier et explorer des réseaux de gènes liés à des phénotypes spécifiques, facilitant ainsi l'interprétation des fonctions génétiques complexes et la génération d'hypothèses sur les maladies humaines.

Kuno, A., Matsumoto, K., Taki, T., Takahashi, S., Mizuno, S.2026-02-20💻 bioinformatics

A New Sparse Bayesian Quantile Neural Network-based Approach and Its Application to Discover Physiological Sweet Spots in the Canadian Longitudinal Study on Aging

En s'appuyant sur les données de l'Étude longitudinale canadienne sur le vieillissement, cette étude propose une nouvelle approche d'apprentissage profond bayésien sparse, le Q-FSNet et le Q-DirichNet, pour identifier 25 métabolites présentant des « points optimaux » physiologiques qui minimisent l'accélération de l'âge biologique, offrant ainsi un outil interprétable pour la médecine de précision.

Min, J., Vishnyakova, O., Brooks-Wilson, A., Elliott, L. T.2026-02-20💻 bioinformatics

OT-knn: a neighborhood-aware optimal transport framework for aligning spatial transcriptomics data

Cet article présente OT-knn, une méthode innovante d'alignement des données de transcriptomique spatiale qui intègre les informations de voisinage local dans un cadre de transport optimal pour surmonter les défis liés au bruit, aux déformations géométriques et à l'hétérogénéité biologique entre les échantillons.

Song, J., Li, Q.2026-02-20💻 bioinformatics

← Précédent Suivant →