A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

CROWN: Curated Repository Of Well-resolved Noncovalent interactions

O artigo apresenta o CROWN, um novo conjunto de dados de 153.005 complexos proteína-ligante curado e pronto para aprendizado de máquina, que resolve o dilema entre cobertura e qualidade ao aplicar um pipeline automatizado com minimização de energia restrita ao banco de dados PLInder, oferecendo uma diversidade quatro vezes maior que conjuntos existentes como PDBBind e HiQBind, sem depender de afinidades de ligação experimentais.

Poelmans, R., Van Eynde, W., Bruncsics, B., Bruncsics, B., Arany, A., Moreau, Y., Voet, A. R.2026-04-01💻 bioinformatics

geneslator: an R package for comprehensive gene identifier conversion and annotation

O artigo apresenta o geneslator, um pacote R que unifica a conversão de identificadores gênicos, mapeamento de ortólogos e anotação de vias para oito organismos modelo, oferecendo um framework preciso e atualizado para superar as limitações de inconsistência e fragmentação das ferramentas existentes.

Cavallaro, G., Micale, G., Privitera, G. F., Pulvirenti, A., Forte, S., Alaimo, S.2026-04-01💻 bioinformatics

Structure-Guided Computational Analysis of Linker effects in an scFv Targeting Guanylyl Cyclase C

Este estudo utiliza modelagem molecular e simulações de dinâmica molecular para analisar como diferentes designs de linkers afetam a estabilidade estrutural e a ligação ao antígeno de um scFv direcionado ao receptor Guanylyl Cyclase C, estabelecendo um quadro computacional para a otimização racional de fragmentos de anticorpos contra o câncer colorretal.

Melo, R., Viegas, T.2026-04-01💻 bioinformatics

T-Rex: Standardized Analysis of Germline Variants in Whole-Exome Sequencing Trios

O artigo apresenta o T-Rex, uma aplicação de desktop de código aberto que permite a análise padronizada e local de dados de sequenciamento de exoma completo (WES) de trios sem exigir conhecimentos de programação, integrando ferramentas de ponta para chamada de variantes, anotação e filtragem estatística para auxiliar clínicos e pesquisadores na identificação de variantes germinativas raras associadas a doenças pediátricas.

Reh, S.-L., Walter, C., Lohse, J., Ghete, T., Metzler, M., Quante, A., Hauer, J., Auer, F.2026-04-01💻 bioinformatics

STAPLE: automating spatial transcriptomics analysis and AI interpretation

O STAPLE é um sistema modular que automatiza e unifica fluxos de trabalho de transcriptômica espacial, integrando diversas ferramentas para análises de ponta a ponta e utilizando inteligência artificial para gerar relatórios interpretativos biológicos.

Lvovs, D., Quinn, J., Forjaz, A., Santana-Cruz, I., Stapleton, O., Vavikolanu, K., Wetzel, M., Data Science Hub TeamLab,, Demystifying Pancreatic Cancer Therapies TeamLab,, Pagan, V. B., Herb, B. R. (…)2026-04-01💻 bioinformatics

Dynamic multimodal survival prediction in multiple myeloma integrating gene expression, longitudinal laboratories, and treatment history

Os autores desenvolveram um modelo dinâmico multimodal que integra expressão gênica, trajetórias laboratoriais longitudinais e histórico de tratamento para prever a sobrevida global residual em pacientes com mieloma múltiplo, superando métodos de base existentes e demonstrando robustez em coortes independentes.

JIA, S., Lysenko, A., Boroevich, K. A., Sharma, A., Tsunoda, T.2026-04-01💻 bioinformatics

Robust Random Forests for Genomic Prediction: Challenges and Remedies

Este artigo propõe e avalia estratégias robustas para Florestas Aleatórias na predição genômica, demonstrando que a transformação de dados, particularmente baseada em rankings, é a abordagem mais eficaz para mitigar os efeitos da contaminação de dados, embora a adoção dessas técnicas deva ser condicionada à qualidade dos dados e aos objetivos específicos de melhoramento genético.

Lourenco, V. M., Ogutu, J. O., Piepho, H.-P.2026-04-01💻 bioinformatics

SSPSPredictor: A Sequence and Structure based Deep Learning Model for Predicting Phase-Separating Proteins

O artigo apresenta o SSPSPredictor, um modelo de aprendizado profundo multimodal que combina informações de sequência e estrutura para prever com alta precisão e interpretabilidade proteínas que sofrem separação de fases líquida, revelando também uma correlação entre mutações patogênicas em regiões desordenadas e a propensão a essa separação.

Wang, T., Liao, S., Qi, Y., Zhang, Z.2026-04-01💻 bioinformatics

Accurate detection of mosaic mutations at short tandem repeats from bulk sequencing data

O artigo apresenta o BulkMonSTR, uma nova ferramenta computacional que utiliza modelagem de erros específica para STRs e classificação por aprendizado de máquina para detectar com alta precisão mutações mosaico em repetições de tandem curtas a partir de dados de sequenciamento de nova geração, superando os métodos existentes e permitindo a investigação sistemática do papel dessas mutações no envelhecimento e em doenças.

Wang, W., Li, W., Wang, C., Fan, W., Xia, Y., Yang, X., Chu, C., Dou, Y.2026-04-01💻 bioinformatics