A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

BiOS: An Open-Source Framework for the Integration of Heterogeneous Biodiversity Data

O artigo apresenta o BiOS, um framework de código aberto e modular que integra dados heterogéneos de biodiversidade através de uma arquitetura desacoplada, oferecendo tanto uma API robusta para desenvolvedores quanto uma interface web intuitiva para explorar dados taxonómicos, genéticos e geoespaciais em conformidade com os princípios FAIR.

Roldan, A., Duran, T. G., Far, A. J., Capa, M., Arboleda, E., Cancellario, T.2026-03-16💻 bioinformatics

SC-BIG: A Hierarchical Bayesian Model for Bulk-Informed Single Nucleotide Variant Calling in Single Cells

O artigo apresenta o SC-BIG, um modelo bayesiano hierárquico que utiliza dados de sequenciamento em massa para melhorar a detecção de variantes de nucleotídeo único somáticas em células únicas, superando métodos existentes ao incorporar incertezas biológicas e fornecer probabilidades posteriores calibradas para análises downstream.

Schuette, D., Kono, T. J. Y., Schwarz, R. F.2026-03-16💻 bioinformatics

An explanatory benchmark of spatial domain detection reveals key drivers of method performance

Este estudo apresenta um benchmark explicativo abrangente de 26 métodos de detecção de domínios espaciais, demonstrando que a resolução dos dados e a heterogeneidade celular são os principais fatores que influenciam o desempenho e revelando que o pré-processamento e a escolha de clustering impactam mais os resultados do que a inovação arquitetural das redes neurais.

Descoeudres, A., Prusina, T., Schmidt, N., Do, V. H., Mages, S., Klughammer, J., Matijevic, D., Canzar, S.2026-03-16💻 bioinformatics

Detecting Manuscripts Related to Computable Phenotypes Using a Transformer-based Language Model

Os autores desenvolveram um modelo baseado em BioBERT e uma interface integrada à plataforma CIPHER para identificar automaticamente definições de fenótipos computáveis na literatura biomédica, alcançando 95% de precisão e permitindo feedback contínuo dos curadores para refinar o sistema.

Chae, J., Heise, D. A., Connatser, K., Honerlaw, J., Maripuri, M., Ho, Y.-L., Fontin, F., Tanukonda, V., Cho, K.2026-03-16💻 bioinformatics

High-Fidelity Long-term Whole-embryo Lineage and Fate Reconstruction by Iterative Tracking with Error Correction

Este artigo apresenta o ITEC, um método não supervisionado de alta fidelidade que permite a reconstrução automática e precisa das linhagens celulares e mapas de destino de embriões inteiros em escala de terabytes, validado em múltiplas espécies e capaz de revelar dinâmicas morfogênicas complexas.

Wang, M., Zhang, Q., Wang, C., Chi, Y., Zheng, W., Mu, Z., Cao, X., Zhang, W., Yang, B., Schier, A. F., Acedo, J. N., Wan, Y., Yu, G.2026-03-16💻 bioinformatics

Integrative modeling of read depth and B-allele frequency improves single-cell copy number calling from targeted DNA sequencing panels

O artigo apresenta o scPloidyR, um novo modelo estatístico que integra profundidade de leitura e frequência de alelos B para melhorar a precisão na detecção de variações no número de cópias em células únicas a partir de painéis de sequenciamento direcionado, demonstrando que essa abordagem conjunta supera os métodos baseados apenas em profundidade quando informações alélicas estão disponíveis.

Pei, D., Griffard-Smith, R., Cano Urrego, B., Schueddig, E.2026-03-16💻 bioinformatics

Chemically informed representations of amino acids enable learning beyond the canonical protein alphabet

Os autores apresentam uma representação quimicamente informada de peptídeos baseada em estruturas moleculares bidimensionais que permite aos modelos de aprendizado de máquina generalizar para aminoácidos modificados e capturar propriedades físico-químicas diretamente, superando as limitações do alfabeto padrão de vinte aminoácidos.

Christiansen, J. C., Gonzalez-Valdes Tejero, M., Hembo, C. S., Li, Y., Barra, C.2026-03-16💻 bioinformatics

UniST: A Unified Computational Framework for 3D Spatial Transcriptomics Reconstruction

O UniST é uma estrutura unificada de inteligência artificial generativa que reconstrói paisagens de transcriptômica espacial 3D densas e contínuas a partir de seções seriadas esparsas, integrando módulos de amostragem, interpolação e imputação para restaurar a arquitetura tecidual e padrões de expressão gênica biologicamente significativos em diversos contextos biológicos.

Shui, L., Liu, Y., Julio, I. C. L., Clemenceau, J. R., Hoi, X. P., Dai, Y., Lu, W., Min, J., Khan, K., Roemer, B., Jiang, M., Waters, R. E., Colbert, K., Maitra, A., Wintermark, M., Yuan, Y., Chan, K. (…)2026-03-16💻 bioinformatics