A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Correlate: A Web Application for Analyzing Gene Sets and Exploring Gene Dependencies Using CRISPR Screen Data

O artigo apresenta o Correlate, uma aplicação web gratuita e acessível que permite explorar dados de telas CRISPR do Cancer Dependency Map para analisar conjuntos de genes e dependências genéticas diretamente a partir de resultados funcionais, oferecendo uma perspectiva orientada por dados complementar às abordagens baseadas em conhecimento prévio.

Deolankar, S., Wermeling, F.2026-04-04💻 bioinformatics

snoFlake: A network model for snoRNA-RBP complexes reveals SNORD22 as a U5 snRNP-associated splicing regulator

O estudo apresenta o modelo de rede snoFlake, que desafia a visão tradicional das snoRNAs ao revelar que a SNORD22 forma um complexo não canônico com componentes do U5 snRNP para regular o splicing alternativo de éxons fracos, expandindo assim o escopo funcional do snoRNome.

Song, K. S., Cyr, M., Faucher-Giguere, L., Yeo, B., Seow, V. K., Deschamps-Francoeur, G., Abou Elela, S., Scott, M. S.2026-04-04💻 bioinformatics

Structure-Guided Design and Dynamic Evaluation of VP4-Targeting siRNAs Against Rotavirus A

Este estudo apresenta uma abordagem computacional integrada para o desenho e avaliação dinâmica de siRNAs que visam a proteína VP4 do Rotavírus A, identificando candidatos otimizados com alta estabilidade estrutural e compatibilidade com a maquinaria de carga do RISC para futura validação experimental.

Ahmed, A. N., Satu, K. J., Rahman, A. B. Z. N., Hasan, S. S., Sakib, M. N., Hossan, M. E., Bhattacharjee, A., Chowdhury, Z. M., Joy, Z. F., Islam, M. J., Hossain, M. U.2026-04-04💻 bioinformatics

Improved quantitation in data-independent acquisition proteomics via retention time boundary imputation

O artigo apresenta o Nettle, uma ferramenta de código aberto que melhora a quantificação na proteômica de aquisição independente de dados (DIA) ao imputar os limites de tempo de retenção de peptídeos em vez de valores ausentes, resultando em maior precisão, menor limite de quantificação e a capacidade de obter razões quantitativas em casos anteriormente impossíveis.

Harris, L. J., Riffle, M., Shulman, N., Fondrie, W. E., Wu, C. C., Johnson Erickson, D. P., Morimoto, A., Shaver, B., Stein, T., Cao, N., Ford, E., Noble, W. S., MacCoss, M. J.2026-04-03💻 bioinformatics

PlantCAD2: a DNA foundation model for interpreting genomes across flowering plants

O artigo apresenta o PlantCAD2, um modelo de linguagem de DNA específico para plantas com 676 milhões de parâmetros e uma janela de contexto estendida, que foi pré-treinado em 65 genomas de angiospermas e demonstrou superar modelos existentes na previsão de conservação evolutiva e regulação gênica, estabelecendo-se como uma ferramenta fundamental para a anotação precisa de genomas em diversas espécies vegetais.

Zhai, J., Gokaslan, A., Hsu, S.-K., Chen, S.-P., Liu, Z.-Y., Marroquin, E., Czech, E., Cannon, B., Berthel, A., Romay, C., Pennell, M., Kuleshov, V., Buckler, E. S.2026-04-03💻 bioinformatics

PathogenSurveillance: an automated pipeline for population genomic analyses and pathogen identification

O artigo apresenta o PathogenSurveillance, um pipeline automatizado e de código aberto baseado em Nextflow que realiza análises genômicas populacionais e identificação de patógenos a partir de dados de sequenciamento de genoma completo, facilitando a biossegurança em tempo real para uma resposta rápida a novas ameaças.

Foster, Z. S. L., Sudermann, M. A., Parada Rojas, C. H., Blair, L. K., Iruegas Bocardo, F., Dhakal, U., Alcala-Briseno, R. I., Phan, H., Schummer, T. R., Weisberg, A. J., Chang, J. H., Grunwald, N. J.2026-04-03💻 bioinformatics

CellWHISPER disentangles direct cell-cell communication from structural proximity

O artigo apresenta o CellWHISPER, um novo framework estatístico escalável e rigoroso que utiliza dados de transcriptômica espacial para distinguir comunicação celular direta (como junções comunicantes e receptores de ligantes) da mera proximidade estrutural, permitindo a descoberta de programas de sinalização específicos de tecidos e doenças com validação experimental.

Kumar, A., Moctezuma, F. R., Aggarwal, B., Zhang, N., Coskun, A. F., Sinha, S.2026-04-03💻 bioinformatics

seq2ribo: Structure-aware integration of machine learning and simulation to predict ribosome location profiles from RNA sequences

O artigo apresenta o seq2ribo, um framework híbrido que combina simulação de TASEP estruturalmente consciente e aprendizado de máquina para prever com alta fidelidade os perfis de localização de ribossomos e a expressão proteica a partir apenas da sequência de RNA, superando métodos anteriores e habilitando o design racional de mRNA.

Kaynar, G., Kingsford, C.2026-04-03💻 bioinformatics

Dynamic Consistency Reveals Predictable Genes in Cross-Cell Type Temporal scRNA-Seq Data

Este artigo apresenta o Índice de Consistência Dinâmica (DCI) para identificar genes com trajetórias temporais previsíveis entre diferentes tipos celulares em dados de trauma, demonstrando que a seleção baseada nesse índice combinada com modelagem recorrente incerta melhora significativamente a precisão na previsão da evolução da expressão gênica.

Shi, J., Wu, R., Liu, Y., Li, R., Duprey, A.2026-04-03💻 bioinformatics