A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

CancerSTFormer enables multi-scale analysis of spot-resolution spatial transcriptomes and dissects the gene and immune regulatory responses of targeted therapies

O CancerSTFormer é uma ferramenta baseada em modelos fundacionais de transcriptômica espacial que permite a análise multi-escala de nichos celulares em tumores, identificando genes regulatórios e dissecando as respostas de terapias-alvo e imunoterapias através de análise de perturbação.

Strope, B., Varghese, D., Bowie, W., Wang, S., Zhu, Q.2026-03-03💻 bioinformatics

The One Click Wonder: a retrained automated segmentation pipeline that enables quantitative and modular analysis of C. elegans embryos

Os autores desenvolveram o pipeline automatizado "One Click Wonder" (OCW), combinado com a ferramenta BAAM, para superar os desafios de segmentação em imagens 3D de embriões de *C. elegans* e permitir uma análise quantitativa e modular da expressão gênica em nível de célula única.

Bassett, P. C., Verheijen, T. E., Angonezi, A. L., Andriollo, A., Herbert, S., Roth, G., Chao, J., Mango, S. E.2026-03-03💻 bioinformatics

STCS: A Platform-Agnostic Framework for Cell-Level Reconstruction in Sequencing-Based Spatial Transcriptomics

O artigo apresenta o STCS, um framework de código aberto e agnóstico à plataforma que reconstrói perfis de expressão gênica em nível celular a partir de dados de transcriptoma espacial de alta resolução, superando limitações de métodos existentes e permitindo análises biológicas mais precisas sem necessidade de anotações de referência.

Chen Wu, L., Hu, X., Zhan, F., Sun, C., Gonzales, J., Ofer, R., Tran, T., Verzi, M. P., Liu, L., Yang, J.2026-03-03💻 bioinformatics

snputils: A High-Performance Python Library for Genetic Variation and Population Structure

O artigo apresenta o snputils, uma biblioteca Python de alto desempenho e código aberto que unifica a entrada/saída, transformação e análise de dados genéticos em um único framework escalável para superar as limitações de incompatibilidade e ineficiência computacional das ferramentas existentes, facilitando assim pesquisas em genética populacional e medicina de precisão.

Bonet, D., Comajoan Cara, M., Barrabes, M., Smeriglio, R., Agrawal, D., Aounallah, K., Geleta, M., Dominguez Mantes, A., Thomassin, C., Shanks, C., Huang, E. C., Franquesa Mones, M., Luis, A., Saurina (…)2026-03-03💻 bioinformatics

A comprehensive assessment of tandem repeat genotyping methods for Nanopore long-read genomes

Este estudo realiza uma avaliação abrangente de métodos de genotipagem de repetições em tandem em genomas de leitura longa do Nanopore, demonstrando que a precisão na sequência é crucial para a seleção de ferramentas e que nenhum método único se destaca em todos os cenários, oferecendo diretrizes práticas para estudos populacionais e diagnósticos clínicos.

Aliyev, E., Avvaru, A., De Coster, W., Arner, G. M., Nyaga, D. M., Gibson, S. B., Weisburd, B., Gu, B., Gonzaga-Jauregui, C., 1000 Genomes Long-Read Sequencing Consortium,, Chaisson, M. J. P., Miller (…)2026-03-03💻 bioinformatics

Large-Scale Statistical Dissection of Sequence-Derived Biochemical Features Distinguishing Soluble and Insoluble Proteins

Este estudo realizou uma análise estatística rigorosa em larga escala de 78.031 proteínas, revelando que a solubilidade proteica é governada por efeitos coordenados e fracos de baixa dimensionalidade, onde características relacionadas ao tamanho e à carga negativa constituem os principais determinantes sequenciais, estabelecendo uma linha de base estatística transparente para a caracterização da solubilidade.

Vu, N. H. H., Nguyen Bao, L.2026-03-03💻 bioinformatics

The limits of Bayesian estimates of divergence times in measurably evolving populations

Este estudo demonstra que, em populações evolutivas mensuráveis com dados heterocrônicos, a incerteza na estimativa de tempos de divergência não depende da idade absoluta dos nós, mas sim da distância até a calibração mais próxima, estabelecendo limites teóricos fundamentais para a precisão de análises filogenéticas em surtos virais e bacterianos.

Ivanov, S., Fosse, S., dos reis, M., Duchene, S.2026-03-03💻 bioinformatics

Phenotypic Bioactivity Prediction as Open-set Biological Assay Querying

O artigo apresenta o OpenPheno, um modelo fundamental multimodal que redefine a previsão de bioatividade como uma tarefa de questionamento visual-linguístico em conjunto aberto, permitindo prever a atividade de compostos em ensaios biológicos não vistos a partir de perfis fenotípicos universais (Cell Painting) e descrições textuais, superando assim as limitações dos paradigmas de conjunto fechado e reduzindo drasticamente custos e tempo na descoberta de fármacos.

Sun, Y., Zhang, X., Zheng, Q., Li, H., Zhang, J., Hong, L., Wang, Y., Zhang, Y., Xie, W.2026-03-03💻 bioinformatics