A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

A ML-framework for the discovery of next-generation IBD targets using a harmonized single-cell atlas of patient tissue

Este estudo apresenta um quadro integrado de aprendizado de máquina e validação experimental que utiliza um atlas unificado de células únicas para descobrir e validar novos alvos terapêuticos específicos de tipos celulares para a Doença Inflamatória Intestinal (DII), superando as limitações das abordagens genéticas tradicionais.

Joglekar, A., Joseph, A., Honsa, P., Ruppova, K., Pizzarella, V., Honan, A., Mediratta, D., Vollmer, E., Geller, E., Valny, M., Macuchova, E., Zheng, S., Greenberg, A., Taus, P., Kline-Schoder, A., Ko (…)2026-02-16💻 bioinformatics

Learning fragment-based segmentation of binding sites from molecular dynamics: a proof-of-concept on cardiac myosin.

Este artigo apresenta o FragBEST-Myo, uma ferramenta de aprendizado profundo baseada em segmentação semântica que utiliza mapas de fragmentos e dinâmicas moleculares para identificar e selecionar conformações de miosina cardíaca aptas ao ligação, demonstrando sua eficácia como prova de conceito para o desenvolvimento de modelos gerais aplicáveis a outras proteínas.

Yang, Y.-Y., Pickersgill, R. W., Fornili, A.2026-02-16💻 bioinformatics

Benchmarking within-sample minority variant detection with short-read sequencing in M. tuberculosis

Este estudo avaliou sete ferramentas de chamada de variantes para detectar variantes minoritárias em *Mycobacterium tuberculosis*, identificando o FreeBayes como a ferramenta de melhor desempenho e desenvolvendo um novo modelo de erro que, quando aplicado a ele, elimina quase metade dos falsos positivos sem comprometer a detecção de variantes verdadeiras.

Mulaudzi, S., Kulkarni, S., Marin, M. G., Farhat, M. R.2026-02-16💻 bioinformatics

Accurate Macromolecular Complex Modeling for Cryo-EM with CryoZeta

O artigo apresenta o CryoZeta, uma ferramenta de modelagem *de novo* que utiliza uma rede neural generativa baseada em difusão para integrar dados de microscopia crioeletrônica e previsões de sequência, superando os métodos existentes na geração de modelos estruturais precisos de complexos macromoleculares, mesmo em resoluções não atômicas.

Zhang, Z., Li, S., Farheen, F., Kagaya, Y., Liu, B., Ibtehaz, N., Terashi, G., Nakamura, T., Zhu, H., Khan, K., Zhang, Y., Kihara, D.2026-02-16💻 bioinformatics

SMECT: a framework for benchmarking post-GWAS methods for spatial mapping of cells associated with human complex traits

O artigo apresenta o SMECT, um framework pioneiro para avaliar métodos de mapeamento espacial de células associadas a traços complexos humanos, demonstrando que a ferramenta DESE supera as limitações de sensibilidade e especificidade de abordagens existentes como S-LDSC e scDRS.

Liu, M., Xue, C., Luo, Y., Peng, W., Ye, L., Zhang, L., Wei, W., Li, M.2026-02-16💻 bioinformatics

IntelliFold-2: Surpassing AlphaFold 3 via Architectural Refinement and Structural Consistency

O IntelliFold-2 é um modelo de código aberto de previsão de estrutura biomolecular que supera o AlphaFold 3 em precisão e robustez através de refinamentos arquitetônicos e consistência estrutural multiescala, oferecendo ganhos significativos em interações anticorpo-antígeno e dobramento proteína-ligante, além de disponibilizar três variantes para diferentes necessidades de inferência.

Qiao, L., Yan, H., Liu, G., Guo, G., Sun, S.2026-02-14💻 bioinformatics

MassID provides near complete annotation of metabolomics data with identification probabilities

O artigo apresenta o MassID, um pipeline de metabolômica não direcionada baseado em nuvem que utiliza aprendizado profundo e o módulo DecoID2 para fornecer identificação probabilística de metabólitos com controle de taxa de descoberta falsa, permitindo a anotação quase completa de sinais e a descoberta de milhares de compostos com alta especificidade.

Stancliffe, E., Gandhi, M., Guzior, D. V., Mehta, A., Acharya, S., Richardson, A. D., Cho, K., Cohen, T., Patti, G. J.2026-02-14💻 bioinformatics

Cell phenotypes in the biomedical literature: a systematic analysis and text mining corpus

Este artigo apresenta o corpus CellLink, uma coleção manualmente anotada de mais de 22.000 menções a populações celulares que permite analisar padrões de nomenclatura na literatura, treinar modelos de reconhecimento de entidades e aprimorar a ontologia celular (CL) através de técnicas de mineração de texto e aprendizado de máquina.

Rotenberg, N. H., Leaman, R., Islamaj, R., Kuivaniemi, H., Tromp, G., Fluharty, B., Richardson, S., Eastwood, C., Diller, M., Xu, B., Pankajam, A. V., Osumi-Sutherland, D., Lu, Z., Scheuermann, R. H.2026-02-14💻 bioinformatics