La bioinformatique se situe à la croisée fascinante de la biologie et de l'informatique, où des données biologiques complexes sont transformées en connaissances actionnables grâce à des algorithmes puissants. Ce domaine permet aux chercheurs de décrypter le code de la vie, d'analyser des séquences génétiques massives et de modéliser des interactions moléculaires avec une précision inédite, accélérant ainsi les découvertes médicales et biologiques.

Sur Gist.Science, nous nous engageons à rendre ces travaux accessibles à tous. Chaque nouvelle prépublication soumise sur bioRxiv dans cette catégorie est traitée par nos soins, offrant à la fois un résumé technique détaillé pour les experts et une explication claire en langage courant pour le grand public.

Vous trouverez ci-dessous la sélection des dernières études parues dans ce domaine, prêtes à être explorées.

Nanoscale Material Size Shapes Distinct Immune Transcriptional States Under Physiological Flow

En combinant l'exposition microfluidique sous flux physiologique au séquençage de l'ARN unicellulaire, cette étude révèle que la taille des nanoplastiques et la complexité de l'exposition façonnent des états transcriptionnels immunitaires distincts et non linéaires, notamment une remodelage dépendant de la taille chez les monocytes et un ajustement transcriptionnel préservant la lignée chez les lymphocytes B et T.

Kovacevic, V., Milivojevic Dimitrijevic, N., Mihailovich, M., Zivanovic, M., Ivanovic, M., Zivic, A., Jankovic, M. G., Kovacevic, A., Zmrzljak, U. P., Puac, F., Filipovic, N., Ljujic, B.2026-03-13💻 bioinformatics

SAMWOOD: An automated method to measure wood cells along growth orientation

Ce papier présente SAMWOOD, une méthode automatisée basée sur le modèle Segment-Anything (zero-shot) qui permet de segmenter et mesurer avec précision les cellules du bois sur des images microscopiques, réduisant ainsi considérablement le temps d'analyse et les biais humains tout en offrant une robustesse face aux artefacts et à l'hétérogénéité des échantillons.

Verlingue, K., Brunel, G., Decombeix, A.-L., Ramel, M., Tresson, P.2026-03-13💻 bioinformatics

Multiscale conformational sampling of multidomain fusion proteins by a physics informed diffusion model

Les auteurs proposent un modèle de diffusion multiscale informé par la physique, entraîné sur des trajectoires de dynamique moléculaire et utilisant un réseau de neurones à graphes équivariant, pour générer rapidement et avec fidélité des ensembles conformationnels de protéines de fusion multidomaines flexibles, surmontant ainsi les limites de coût computationnel des simulations traditionnelles et accélérant la conception rationnelle de ces biotechnologies.

Su, Z., Wang, B., Wu, Y.2026-03-13💻 bioinformatics

Improving Local Ancestry Inference through Neural Networks

Cet article présente quatre nouvelles méthodes d'inférence de l'ascendance locale basées sur des réseaux de neurones, notamment des architectures LSTM bidirectionnels et des Transformers, qui surpassent les approches existantes grâce à des étapes de prétraitement et de lissage spécialisées, bien que leur puissance d'inférence reste limitée dans les scénarios d'admixture intracontinentale ou lointaine.

Medina Tretmanis, J., Avila-Arcos, M. C., Jay, F., Huerta-Sanchez, E.2026-03-13💻 bioinformatics

SpliceSelectNet: A Hierarchical Transformer-Based Deep Learning Model for Splice Site Prediction

Le modèle SpliceSelectNet (SSNet), basé sur une architecture Transformer hiérarchique, surpasse les méthodes existantes en prédiction de sites d'épissage et en détection d'épissage aberrant en capturant efficacement les dépendances à longue distance jusqu'à 100 kb tout en offrant une interprétabilité biologique grâce à ses scores d'attention.

Miyachi, Y., Nakai, K.2026-03-12💻 bioinformatics

Fleming: An AI Agent for Antibiotic Discovery in Mycobacterium Tuberculosis

Fleming est un agent d'intelligence artificielle intégré qui, en combinant des modèles discriminatifs et génératifs entraînés sur une vaste base de composés, identifie et conçoit de nouveaux candidats-médicaments anti-tuberculeux avec des taux de réussite in vitro et des profils ADMET exceptionnels.

Wei, Z., Ektefaie, Y., Zhou, A., Negatu, D., Aldridge, B. B., Dick, T. B., Skarlinski, M., White, A., Rodriques, S. G., Hosseiniporgham, S., Parai, M., Flores, A., Inna, K. V., Zitnik, M., Sacchettini (…)2026-03-12💻 bioinformatics

Igniting full-length isoform analysis in single-cell and spatial RNA-seq data with FLAMESv2

Le package R/Bioconductor FLAMESv2 est une nouvelle solution modulaire et adaptable conçue pour traiter et analyser les données d'ARN-seq à lecture longue en cellule unique et en transcriptomique spatiale, permettant ainsi une caractérisation complète des isoformes d'ARN et de l'épissage alternatif.

Wang, C., Prawer, Y. D. J., Voogd, O., Schuster, J., Pasquali, C., De Paoli-Iseppi, R., Li, A., Hallab, J., Tian, L., Peng, H., David, M., Du, M. R. M., Velasco, S., Garone, M. G., Dong, X., Zeglinski (…)2026-03-12💻 bioinformatics

Application of large language models to the annotation of cell lines and mouse strains in genomics data

Cette étude démontre que l'utilisation de modèles de langage comme GPT-4o, couplée à une génération augmentée par récupération (RAG), permet d'assister efficacement les curateurs humains dans l'annotation des lignées cellulaires et des souches de souris en génomique, offrant une précision nettement supérieure aux méthodes traditionnelles tout en identifiant des erreurs de curation manuelle.

Rogic, S., Mancarci, B. O., Xu, B., Xiao, A., Yan, C., Pavlidis, P.2026-03-12💻 bioinformatics