A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Multistage Machine Learning Reveals Circadian Gene Programs and Supports a Retina-Choroid Axis in Myopia Development

Este estudo utiliza aprendizado de máquina multietapa para demonstrar que o timing circadiano, especificamente na janela ZT8-ZT12, define programas gênicos críticos e coordenados entre retina e coróide que orientam o desenvolvimento da miopia, com mecanismos conservados entre espécies que podem influenciar a suscetibilidade e o tratamento da doença.

Watcharapalakorn, A., Poyomtip, T., Tawonkasiwattanakun, P., Dewi, P. K. K., Thomrongsuwannakij, T., Mahawan, T.2026-04-06💻 bioinformatics

sctrial: Participant-Level Differential Analysis for Longitudinal Single-Cell Experiments

O artigo apresenta o *sctrial*, uma ferramenta de código aberto em Python que permite análises diferenciais robustas em nível de participante para experimentos de RNA de célula única longitudinais, resolvendo o problema de pseudorreplicação e garantindo taxas de erro calibradas em estudos clínicos e translacionais.

Vasanthakumari, P., Valencia, I., Aghmiouni, M. R., Magana, B., Omar, M. N.2026-04-06💻 bioinformatics

Halo: a pretrained model for whole-cell segmentation from nuclei images in spatial transcriptomics

O artigo apresenta o Halo, um modelo pré-treinado que integra a morfologia nuclear e a distribuição espacial de transcritos de RNA para realizar segmentação precisa de células inteiras em dados de transcriptômica espacial, superando as estratégias tradicionais de expansão nuclear e permitindo a aplicação direta em diversos tecidos sem necessidade de re-treinamento.

Zhang, X., Zhuang, H., Ji, Z.2026-04-06💻 bioinformatics

From nucleotides to semantics: genomic representation learning via joint-embedding predictive architecture

O artigo apresenta o GenoJEPA, um novo framework de aprendizado de representação genômica baseado em arquitetura de incorporação conjunta preditiva que, ao substituir a reconstrução de bases locais por alinhamento semântico, oferece maior eficiência computacional e generalização robusta em diversas tarefas downstream sem a necessidade de ajuste fino.

Wang, C., Qi, Q., Sun, H., Zhuang, Z., He, B., Liu, S., Liao, J., Wang, J.2026-04-06💻 bioinformatics

Looplook: An integrative suite for target assignment and functional annotation of chromatin interactions empowered by expression-aware refinement and connected components clustering

O artigo apresenta o Looplook, uma suite computacional de código aberto em R que integra dados de arquitetura 3D do cromatina com perfis de expressão gênica para refinar a atribuição de alvos e a anotação funcional de interações cromatínicas, eliminando falsos positivos e permitindo a construção de redes regulatórias espaciais de alta confiança.

Zhang, Y., Huang, X., Chen, Y., Xu, L.2026-04-06💻 bioinformatics

Sequence-Driven Drug-Target Affinity Prediction Via Graph Attention Networks and Bidirectional Cross-Attention Fusion

O artigo apresenta o XAttn-DTA, um modelo de aprendizado profundo que prevê a afinidade droga-alvo apenas a partir de sequências, utilizando redes de atenção gráfica para moléculas e mapas de contato preditos por ESM2 para proteínas, combinados por um mecanismo de atenção cruzada bidirecional que supera significativamente os métodos existentes em benchmarks padrão e cenários de inicialização fria.

Kudari, Z., Kaira, V. S., P, S. S., Bhat, R., Gnana Sekaran, J.2026-04-06💻 bioinformatics

Unravelling genome-wide mosaic microsatellite mutations at single-cell resolution

Os autores desenvolveram o algoritmo BayesMonSTR para detectar com precisão mutações mosaic em microssatélites em nível de célula única, revelando que o envelhecimento e o tecido neuronal estão associados a um acúmulo significativo de deleções e inserções nessas regiões regulatórias do genoma.

Wang, C., Fan, W., Wang, W., Xia, Y., Lu, J., Ma, X., Yu, J., Zheng, Y., Luo, Y., Li, W., Yang, Q., Lin, M., Liu, H., Lan, Y., Li, C., Liu, X., HE, D., Cai, S., Yu, X., Zhou, D., Kellis, M., Xiong, X. (…)2026-04-05💻 bioinformatics

Widespread data leakage inflates accuracy and corrupts biomarker discovery in cancer drug response prediction

Este estudo demonstra que a prática generalizada de triagem de recursos supervisionada antes da validação cruzada em modelos de previsão de resposta a medicamentos contra o câncer causa vazamento de dados que infla artificialmente a precisão e corrompe a descoberta de biomarcadores, comprometendo a validade de uma grande parte da literatura publicada.

Asiaee, A., Strauch, J., Azinfar, L., Pal, S., Pua, H. H., Long, J. P., Coombes, K. R.2026-04-05💻 bioinformatics

Comprehensive characterization of V(D)J recombination from long-read transcriptomic data with VDJcraft

O artigo apresenta o VDJcraft, um pipeline integrado pioneiro que utiliza dados de transcriptoma de leitura longa para caracterizar com precisão a recombinação V(D)J, superando métodos existentes na detecção de genes e na descoberta de novos subtipos, além de permitir a identificação de assinaturas imunológicas associadas a doenças como a COVID-19.

Hu, K., Rosenberg, A. F., Song, Y., Fan, C.-H., Peng, Z., Gao, M., Chong, Z.2026-04-05💻 bioinformatics