A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

O BTEXgenie é uma ferramenta curada e amigável ao usuário que utiliza modelos ocultos de Markov de perfil personalizados para alcançar sensibilidade significativamente superior à de bancos de dados existentes na detecção de genes específicos de substrato envolvidos na degradação aeróbica e anaeróbica de BTEX, ao mesmo tempo em que fornece visualizações integradas de vias metabólicas e genômicas para estudos genômicos ambientais e comparativos.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

Este estudo revela que o TDP-43 regula a transcrição gênica e facilita o enovelamento de cromatina de longo alcance ao se ligar e estabilizar estruturas de G-quadruplexo de DNA nos ancoradouros dos loops de cromatina, fornecendo assim uma explicação mecanicista para a desregulação gênica em doenças associadas à disfunção do TDP-43.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

Este artigo apresenta uma estrutura bayesiana modular, exemplificada pelo software Plasmotrack para *Plasmodium falciparum*, que reconstrói redes de transmissão direcionadas a partir de infecções policlonais ao acomodar múltiplas fontes genéticas e pais não observados para estimar métricas-chave de saúde pública.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

Este artigo apresenta protocolos computacionais e exemplos práticos para automatizar a anotação de RNA não codificante viral e recuperar dados do Rfam programaticamente por meio de sua API RESTful, ao mesmo tempo em que aproveita o R2DT para gerar visualizações abrangentes de estruturas 2D para integração em fluxos de trabalho de bioinformática e aprendizado de máquina.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

O artigo apresenta o PXN, um framework de aprendizado de máquina probabilístico que supera a incompatibilidade entre plataformas em dados públicos de expressão gênica ao traduzir, de forma transparente, conjuntos de dados diversos (incluindo a integração das tecnologias de microarray e RNA-seq) em uma representação unificada, aprimorando assim significativamente a precisão e o poder estatístico de análises biológicas integrativas em larga escala.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

Os autores desenvolveram o TriCyP, uma ferramenta baseada em modelo de linguagem de proteínas que prevê com precisão os estados funcionais da cisteína (ligação dissulfeto, coordenação metálica e tióis livres) a partir de estruturas previstas, permitindo um catálogo em escala proteômica de 2,7 milhões de cisteínas em domínios ECOD que revela padrões biológicos distintos e identifica novas famílias de ligação a metais e potenciais interações proteína-proteína.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

O artigo apresenta o Aiki-Sol, um preditor de solubilidade de proteínas que supera o platô de desempenho dos modelos existentes ao considerar explicitamente os regimes de centrifugação como uma característica crítica em vez de ruído, alcançando ganhos significativos de precisão em um novo conjunto de dados de E. coli com anotação de rigor recém-lançado.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

Este artigo apresenta um framework específico de contexto que valida conjuntos de genes de resposta ao estresse ao explorar redes de interação proteína-proteína restritas a genes diferencialmente expressos, demonstrando que genes de "Resposta Principal" com suporte biológico formam sub-redes significativamente interconectadas em diferentes condições de temperatura.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics