A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Horse, not zebra: accounting for lineage abundance in maximum likelihood phylogenetics

Este artigo apresenta dois métodos implementados no software MAPLE que incorporam a abundância das linhagens na inferência filogenética de máxima verossimilhança, demonstrando que priorizar linhagens comuns ("cavalos") em vez de raras ("zebras") melhora drasticamente a precisão e reduz a incerteza em cenários de genômica epidemiológica, como no caso do SARS-CoV-2.

De Maio, N.2026-03-27💻 bioinformatics

Adding layers of information to scRNA-seq data using pre-trained language models

Este artigo propõe uma estratégia para enriquecer a análise de dados de scRNA-seq ao treinar conjuntamente modelos de linguagem pré-treinados em dados quantitativos e literatura biomédica, criando representações comuns que melhoram a funcionalidade, as associações com doenças e a compreensão de trajetórias temporais.

Krissmer, S. M., Menger, J., Rollin, J., Vogel, T. M., Binder, H., Hackenberg, M.2026-03-26💻 bioinformatics

Amaranth: Enhanced Single-Cell Transcript Assembly via Discriminative Modeling of UMI Reads and Internal Reads

O artigo apresenta o Amaranth, um novo montador de transcriptoma de célula única que utiliza modelagem discriminativa das propriedades distintas das leituras UMI e internas para superar as limitações dos métodos atuais e melhorar significativamente a precisão na reconstrução de isoformas completas.

Zang, X. C., Zahin, T., Khan, I. M., Shi, Q., Xing, Y., Shao, M.2026-03-26💻 bioinformatics

Nextstrain automates real-time phylodynamic analysis of open data for endemic and emerging pathogens

O artigo descreve o Nextstrain, uma plataforma automatizada que realiza análises filodinâmicas em tempo real de dados genômicos abertos para 21 vírus e a bactéria *Mycobacterium tuberculosis*, fornecendo insights atualizados diariamente para orientar intervenções de saúde pública.

Andrews, K. R., Chang, J., Roemer, C., Hadfield, J., Lin, V., Brito, A. F., Daodu, R., Joia, I. A., Kistler, K., Li, A. W., Moncla, L. H., Paredes, M. I., Kuhnert, D., Torres, L. M., Voitl, L., Aksame (…)2026-03-26💻 bioinformatics

Scaling and Generalization of Discrete Diffusion Models for Tumor Phylogenies

O artigo demonstra que modelos de difusão discreta escaláveis, especificamente transformers de grafos treinados em dados sintéticos, podem aprender implicitamente as restrições estruturais de filogenias tumorais para gerar árvores evolutivas realistas, embora o desempenho dependa de um equilíbrio cuidadoso na escala do modelo e da diversidade dos regimes de treinamento.

Sabata, S., Schwartz, R.2026-03-26💻 bioinformatics

FoundedPBI: Using Genomic Foundation Models to predict Phage-Bacterium Interactions

O artigo apresenta o FoundedPBI, uma abordagem de aprendizado profundo em ensemble que utiliza modelos de linguagem genômica para prever interações entre fagos e bactérias a partir de sequências de DNA, superando os métodos atuais ao integrar sinais biológicos complementares e resolver o desafio de processar genomas completos que excedem as janelas de contexto dos modelos.

Carrillo Barrera, P., Babey, A., Pena, C. A.2026-03-26💻 bioinformatics

GraphHDBSCAN*: Graph-based Hierarchical Clustering on High Dimensional Single-cell RNA Sequencing Data

O artigo apresenta o GraphHDBSCAN*, uma extensão baseada em grafos e livre de hiperparâmetros do HDBSCAN* que realiza agrupamento hierárquico baseado em densidade em dados de sequenciamento de RNA de célula única, permitindo a recuperação robusta tanto de estruturas hierárquicas biologicamente significativas quanto de partições planas de alta qualidade em conjuntos de dados esparsos e de alta dimensão.

Ghoreishi, S. A., Szmigiel, A. W., Nagai, J. S., Gesteira Costa Filho, I., Zimek, A., Campello, R. J. G. B.2026-03-26💻 bioinformatics