A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Searching the Druggable Genome using Large Language Models

Os autores desenvolveram um servidor DGIdb MCP que permite que modelos de linguagem grandes acessem informações atualizadas sobre interações droga-gene através da API do DGIdb, superando a necessidade de os usuários traduzirem perguntas em linguagem natural para padrões de consulta estruturados.

Schimmelpfennig, L. E., Cannon, M., Cody, Q., McMichael, J., Coffman, A., Kiwala, S., Krysiak, K. J., Wagner, A. H., Griffith, M., Griffith, O. L.2026-04-01💻 bioinformatics

Adaptive Cluster-Count Autoencoders with Dirichlet Process Priors for Geometry-Aware Single-Cell Representation Learning

Este estudo apresenta autoencoders adaptativos com priores de Processo de Dirichlet para aprendizado de representação de células únicas, demonstrando que, embora essa abordagem sacrifique a recuperação de rótulos, ela melhora significativamente a geometria do espaço latente e a fidelidade de visualização, sendo particularmente vantajosa para tarefas de análise de trajetória e programas biológicos.

Fu, Z.2026-04-01💻 bioinformatics

Simplex-Constrained Neural Topic VAEs with Flow Refinement for Interpretable Single-Cell Gene-Program Discovery

O artigo apresenta o Topic-FM, uma família de VAEs de tópicos neurais que utiliza uma prioridade Dirichlet log-normal e um campo de fluxo de transporte ótimo condicional para gerar espaços latentes no simplex que oferecem programas gênicos interpretáveis e melhoram significativamente a precisão de agrupamento e classificação em dados de transcriptômica de células únicas.

Fu, Z.2026-04-01💻 bioinformatics

Benchmark of biomarker identification and prognostic modeling methods on diverse censored data

Este estudo realiza uma ampla comparação de métodos de identificação de biomarcadores e modelagem prognóstica em dados censurados, demonstrando por meio de simulações e análise de dados reais que o CoxBoost e o Adaptive LASSO se destacam em múltiplas métricas, auxiliando pesquisadores na seleção da abordagem mais adequada para dados genômicos.

Fletcher, W. L., Sinha, S.2026-04-01💻 bioinformatics

Serum metabolic signatures of cognitive resilience in a longitudinal aging cohort

Este estudo identificou assinaturas metabólicas no soro, incluindo carnitinas, compostos derivados da dieta e metabólitos de fármacos, que servem como marcadores preditivos e mecanísticos da resiliência cognitiva em uma coorte de envelhecimento acompanhada por 28 anos.

Scheurink, T. A. W., Seo, J. I., David, L. C., Wang, C. X., Solis, D., Zemlin, J., Bergstrom, J., Dorrestein, P. C., Mohanty, I., Molina, A. J. A.2026-04-01💻 bioinformatics

Assessing the potential of bee-collected pollen sequence data to train machine learning models for geolocation of sample origin

Este estudo demonstra que dados de metabarcocodificação de DNA de pólen coletado por abelhas, combinados com modelos de aprendizado de máquina como Random Forest e k-NN, permitem prever com alta precisão a origem geográfica de amostras, validando o uso de dados brutos de sequências sem a necessidade de identificação taxonômica detalhada.

Hayes, R. A., Kern, A. D., Ponisio, L. C.2026-04-01💻 bioinformatics

Introducing circStudio, a Python package for preprocessing, analyzing and modeling actigraphy data

O artigo apresenta o circStudio, um pacote Python que unifica o pré-processamento, a análise e a modelagem matemática de dados de actigrafia em um único framework, facilitando fluxos de trabalho reprodutíveis e a geração de resultados fisiológicos interpretáveis para pesquisas em biologia circadiana, ciência do sono e saúde digital.

Marques, D., Barbosa-Morais, N. L., Reis, C. C. P.2026-04-01💻 bioinformatics

Combining mutation detection with fragmentomics features leads to improved tumor-informed ctDNA detection

Este estudo apresenta uma abordagem de fragmentômica informada por mutações que, ao combinar padrões de comprimento e extremidades de fragmentos de DNA com a detecção de mutações tumorais, melhora a precisão na identificação de DNA tumoral circulante para monitoramento de doença residual mínima e detecção precoce de recidiva no câncer colorretal, sem a necessidade de treinamento de modelos ou calibração complexa.

Lin, Y., Oroperv, C., Frydendahl, A., Rasmussen, M. H., Andersen, C. L., Besenbacher, S.2026-04-01💻 bioinformatics