A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Developing a Standard Definition for Sequences of Concern

Este artigo apresenta uma definição padronizada e um rubricas baseadas em evidências para identificar "sequências de preocupação" em síntese de ácidos nucleicos, desenvolvidas através da análise de 1,1 milhão de sequências e de um processo de revisão com partes interessadas, visando estabelecer uma base comum para políticas e normas de biossegurança.

Alexanian, T., Beal, J., Bartling, C., Berlips, J., Carr, P. A., Clore, A., Cozzarini, H., Diggans, J., El Moubayed, Y., Esvelt, K., Flyangolts, K., Foner, L., Fullerton, P. A., Gemler, B. T., Jagla (…)2026-03-18💻 bioinformatics

A Permutation-Based Framework for Evaluating Bias in Microbiome Differential Abundance Analysis

Este estudo avalia o viés de oito métodos de análise de abundância diferencial em microbiomas através de estratégias de permutação, revelando que abordagens baseadas em distribuição binomial negativa tendem a superestimar a significância estatística, enquanto métodos que corrigem a composicionalidade produzem p-valores excessivamente conservadores, ao passo que testes clássicos como o t-teste e o Wilcoxon demonstraram maior robustez e confiabilidade.

Zeng, K., Fodor, A. A.2026-03-18💻 bioinformatics

Millisecond Prediction of Protein Contact Maps from Amino AcidSequences

Este trabalho apresenta um framework generativo de fluxo que prevê em milissegundos os mapas de contato e a topologia de circuitos de proteínas a partir de sequências de aminoácidos, utilizando uma representação comprimida de elementos de estrutura secundária para capturar com precisão o núcleo de dobramento e facilitar a exploração em larga escala do mapa genótipo-fenótipo.

Lin, R., Ahnert, S. E.2026-03-18💻 bioinformatics

usiGrabber: Automating the curation of proteomics spectra data at scale, making large datasets ready for use in machine learning systems

O artigo apresenta o usiGrabber, um framework escalável e portátil que automatiza a curadoria de grandes conjuntos de dados de espectrometria de massa a partir do PRIDE, permitindo a construção eficiente de datasets atualizados para treinamento de modelos de aprendizado de máquina, como demonstrado na criação de um classificador de fosforilação.

Auge, G., Clausen, M., Ketterer, K., Schaefer, J., Schmitt, N., Altenburg, T., Hartmaring, Y., Raetz, H., Schlaffner, C. N., Renard, B. Y.2026-03-18💻 bioinformatics

DeSCENT: Deconvolutional Single-Cell RNA-seq Enhances Transcriptome-based Cancer Survival Analysis

O artigo apresenta o DeSCENT, um framework que utiliza algoritmos de deconvolução para reconstruir perfis de RNA de célula única a partir de dados de RNA de massa, permitindo uma análise de sobrevivência multimodal que supera os modelos tradicionais baseados apenas em dados de massa ou de célula única em oito coortes de câncer do TCGA.

Zhao, Y., You, Z., Shen, Y., Chu, J., Gong, X., Li, T., Wang, Z., Xu, C., Luo, Z., He, Y.2026-03-18💻 bioinformatics

Hierarchical genomic feature annotation with variable-length queries

O artigo apresenta o HKS, uma estrutura de dados baseada na Transformada de Burrows-Wheeler Espectral que permite anotação exata e hierárquica de k-mers de comprimento variável, resolvendo ambiguidades de correspondência múltipla e melhorando a precisão de atribuição de características genômicas através de um algoritmo de suavização que utiliza contexto de sequência flanqueante.

Alanko, J. N., Ranallo-Benavidez, T. R., Barthel, F. P., Puglisi, S. J., Marchet, C.2026-03-18💻 bioinformatics

HARVEST: Unlocking the Dark Bioactivity Data of Pharmaceutical Patents via Agentic AI

O artigo apresenta o HARVEST, um pipeline de IA autônoma que extrai milhões de registros de bioatividade de patentes farmacêuticas anteriormente inacessíveis, revelando dados inéditos sobre alvos e estruturas químicas e expondo as limitações de generalização dos modelos atuais de inteligência artificial.

Shepard, V., Musin, A., Chebykina, K., Zeninskaya, N. A., Mistryukova, L., Avchaciov, K., Fedichev, P. O.2026-03-18💻 bioinformatics

PREMISE: A Quality-Aware Probabilistic Framework for Pathogen Resolution and Source Assignment in Viral mNGS

O artigo apresenta o PREMISE, um framework probabilístico baseado em alinhamento e implementado em Rust que supera os métodos tradicionais de k-mers na identificação precisa de subtipos virais, estimativa de abundância e detecção de infecções mistas ou recombinações em dados de sequenciamento metagenômico (mNGS) de Influenza A.

Vijendran, S., Dorman, K., Anderson, T. K., Eulenstein, O.2026-03-18💻 bioinformatics