A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Fast structural search for classification of gut bacterial mucin O-glycan degrading enzymes

O artigo apresenta o DEFT, um novo método de aprendizado de máquina que combina abordagens baseadas em sequência e estrutura para prever com maior precisão e eficiência os números da Comissão de Enzimas (EC), permitindo a anotação em larga escala de repertórios enzimáticos bacterianos, como demonstrado na validação experimental de glicosídeo hidrolases em bactérias associadas ao muco intestinal.

Erden, M., Schult, T., Yanagi, K., Sahoo, J. K., Kaplan, D. L., Cowen, L. J., Lee, K.2026-02-18💻 bioinformatics

Resolving Genome-to-Phenotype Links in Bacteria: Machine-Learned Inference from Downsampled k-mer Representations

Este artigo demonstra que um novo algoritmo de downsampling baseado em prefixos, ao reduzir o tamanho dos genomas bacterianos para representações de k-mers, permite o treinamento eficiente de modelos de aprendizado de máquina que alcançam alta precisão na previsão de fenótipos e oferecem explicabilidade, estabelecendo uma alternativa viável quando o uso de genomas completos é inviável.

Regueira, T. G. B., Barra, C., Lund, O.2026-02-18💻 bioinformatics

Information-Content-Informed Kendall-tau Correlation Methodology: Interpreting Missing Values in Metabolomics as Potentially Useful Information

Este artigo apresenta a metodologia ICI-Kt, que trata valores ausentes em dados de metabolômica como informações úteis decorrentes de censura à esquerda, permitindo sua inclusão no cálculo da correlação de Kendall-tau para melhorar a detecção de outliers e a construção de redes de características.

Flight, R. M., Bhatt, P. S., Moseley, H. N. B.2026-02-17💻 bioinformatics

ProteomeLM: A proteome-scale language model enables accurate and rapid prediction of protein-protein interactions and gene essentiality across taxa

O artigo apresenta o ProteomeLM, um modelo de linguagem baseado em transformadores que opera em escala de proteoma inteiro para gerar representações contextuais de proteínas, permitindo a previsão precisa e rápida de interações proteína-proteína e essencialidade gênica em diversas espécies, superando métodos anteriores sem necessidade de supervisão para capturar interações.

Malbranke, C., Zalaffi, G. P., Bitbol, A.-F.2026-02-17💻 bioinformatics

ConNIS and labeling instability: new statistical methods for improving the detection of essential genes in TraDIS libraries

Este artigo apresenta o ConNIS, um novo método estatístico e uma abordagem baseada em dados para determinar genes essenciais em bibliotecas TraDIS, superando as técnicas existentes ao calcular probabilidades precisas de sequências sem inserção e oferecer critérios objetivos para definição de parâmetros, com ferramentas disponíveis em R e na web.

Hanke, M., Harten, T., Foraita, R.2026-02-17💻 bioinformatics

A Robust Framework for Predicting Mutation Effects on Transcription Factor Binding: Insights from Mutational Signatures in 560 Breast CancerGenomes

Este estudo apresenta um quadro robusto baseado em modelos de regressão linear para prever como as mutações somáticas em 560 genomas de câncer de mama alteram a ligação de fatores de transcrição, revelando que processos mutacionais específicos, como os associados à APOBEC e ao envelhecimento, reconfiguram sistematicamente as redes regulatórias gênicas de maneira dependente do subtipo tumoral.

Kilinc, H. H., Otlu, B.2026-02-17💻 bioinformatics

Ancestry-specific performance of variant effect predictors in clinical variant classification

O estudo demonstra que, ao controlar fatores como a frequência alélica, os preditores computacionais de efeitos de variantes apresentam desempenho comparável entre diferentes grupos ancestrais, apoiando assim sua ampla aplicação responsável no diagnóstico genético.

Hoffing, R., Zeiberg, D., Stenton, S. L., Mort, M., Cooper, D. N., Hahn, M. W., O'Donnell-Luria, A., Ward, L. D., Radivojac, P.2026-02-17💻 bioinformatics