A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Differentiable Gene Set Enrichment Analysis for Pathway-Level Supervision in Transcriptomic Learning

Este artigo apresenta o dGSEA, uma abordagem de análise de enriquecimento de conjuntos gênicos diferenciável que substitui as operações de classificação discretas por aproximações suaves e normalização robusta, permitindo a otimização direta de objetivos baseados em vias biológicas em modelos de aprendizado de transcriptômica e melhorando a concordância com resultados clássicos de GSEA sem comprometer o desempenho na previsão de genes individuais.

Li, S., Ruan, Y., Yang, X., Wen, Z., Saigo, H.2026-03-20💻 bioinformatics

Mapping spatial cell-cell communication programs by tailoring chains of cells for transformer neural networks

O artigo apresenta o scCChain, uma nova estrutura baseada em transformadores que mapeia programas de comunicação celular espacialmente resolvidos e localiza pontos críticos de interação em tecidos complexos, superando as limitações dos métodos existentes ao integrar cadeias de células para análise em resolução de spot e unicelular.

Brunn, N., Guitart, L. C., Farhadyar, K., Fullio, C. L., Kailer, J., Vogel, T., Hackenberg, M., Binder, H.2026-03-20💻 bioinformatics

HViLM: A Foundation Model for Viral Genomics Enables Multi-Task Prediction of Pathogenicity, Transmissibility, and Host Tropism

O artigo apresenta o HViLM, o primeiro modelo de fundação para genômica viral, que, ao ser pré-treinado em milhões de sequências virais, alcança desempenho superior e generalização robusta na previsão multi-tarefa de patogenicidade, transmissibilidade e tropismo de hospedeiro, superando métodos baseados em similaridade de sequência.

Davuluri, R. V., Dutta, P., Vaska, J., Surana, P., Sathian, R., Chao, M., Zhou, Z., Liu, H.2026-03-20💻 bioinformatics

Systematic assessment of machine learning-based variant annotation methods for rare variant association testing

Este estudo realiza uma avaliação sistemática de cinco métodos de anotação baseados em aprendizado de máquina, demonstrando que o CADD v1.6 e o v1.7 oferecem a melhor separação de sinais para testes de associação de variantes raras, enquanto o AlphaMissense apresenta calibração inferior, fornecendo assim diretrizes práticas para a seleção de métodos e um novo framework de avaliação baseado em distâncias de Wasserstein.

Aguirre, M., Irudayanathan, F. J., Crow, M., Hejase, H. A., Menon, V. K., Pendergrass, R. K., McCarthy, M. I., Fletez-Brant, K.2026-03-20💻 bioinformatics

Disagreement among variant effect predictors guides experimental prioritization of target proteins

O estudo demonstra que a discordância entre preditores computacionais de efeitos de variantes não correlaciona com a concordância em dados experimentais, sugerindo que priorizar proteínas com baixa concordância entre esses preditores maximiza o valor informativo de novos ensaios experimentais para a interpretação de variantes genéticas.

Jonsson, N. F., Marsh, J. A., Lindorff-Larsen, K.2026-03-20💻 bioinformatics

ISdetector: precise mapping of insertion sequences and associated structural variations from short-read sequencing data

O artigo apresenta o ISdetector, uma pipeline bioinformática escalável e precisa que mapeia coordenadas exatas de inserção de sequências de inserção (IS) e suas variações estruturais associadas em genomas bacterianos e arqueais, superando as limitações de ferramentas existentes ao lidar com elementos repetitivos e genomas de alto conteúdo de GC.

Zhou, Y., Lu, B.2026-03-20💻 bioinformatics

Designing mRNA coding sequence via multimodal reverse translation language modeling with Pro2RNA

O artigo apresenta o Pro2RNA, um modelo de linguagem multimodal que gera sequências de mRNA codificador otimizadas e adaptadas a organismos hospedeiros específicos a partir de sequências proteicas, integrando representações de proteínas, taxonomia e geração de RNA para superar os desafios atuais no design de terapias de ácido nucleico.

Bian, B., Zhang, Y., Zhang, J., Asai, K., Saito, Y.2026-03-20💻 bioinformatics