A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Evaluating Limits of Machine Learning-Assisted Raman Spectroscopy in Classification of Biological Samples

Este estudo demonstra que, embora os algoritmos de aprendizado de máquina tenham impacto mínimo, a precisão na classificação de amostras biológicas por espectroscopia Raman é limitada principalmente pela qualidade dos dados e pela similaridade espectral, exigindo rigoroso controle experimental, redução da variabilidade celular e calibração instrumental para resultados robustos.

Yadav, A., Birkby, A., Armstrong, N., Arnob, A., Chou, M.-H., Fernandez, A., Verhoef, A. J., Yi, Z., Gulati, S., Kotnis, S., Sun, Q., Kao, K. C., Wu, H.-J.2026-03-01💻 bioinformatics

MolX: A Geometric Foundation Model for Protein-Ligand Modelling

O artigo apresenta o MolX, um modelo fundamental baseado em Graph Transformer que, ao aprender representações geométricas e químicas conjuntas de bolsos proteicos e ligantes a partir de dados estruturais 3D em larga escala, alcança desempenho de ponta e generalização robusta em diversas tarefas de descoberta de fármacos, além de oferecer interpretabilidade biológica através de um módulo de autoencoder esparsos.

Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.2026-03-01💻 bioinformatics

Achieving spatial multi-omics integration from unaligned serial sections with DIME

O artigo apresenta o DIME, um novo modelo de aprendizado profundo que utiliza uma estratégia híbrida de alinhamento para integrar representações de dados multi-ômicos espaciais provenientes de seções seriadas não alinhadas, superando a necessidade de interseção de características e permitindo a identificação precisa de domínios espaciais biologicamente significativos.

Sun, P., Huang, X., Mou, T., Zheng, X.2026-02-28💻 bioinformatics

SpatialCompassV (SCOMV): De novo cell and gene spatial pattern classification and spatially differential gene identification

O artigo apresenta o SpatialCompassV (SCOMV), uma ferramenta computacional que classifica padrões espaciais de células e genes e identifica genes diferencialmente espaciais em dados de transcriptômica espacial de câncer, permitindo a caracterização unsupervisionada de distribuições e a discriminação de estados malignos sem depender de conhecimento biológico prévio.

Nomura, R., Sakai, S. A., Kageyama, S.-I., Tsuchihara, K., Yamashita, R.2026-02-28💻 bioinformatics

LRSomatic: a highly scalable and robust pipeline for somatic variant calling in long-read sequencing data

O artigo apresenta o LRSomatic, um pipeline Nextflow escalável e robusto para a detecção abrangente de variantes somáticas em dados de sequenciamento de leitura longa (PacBio HiFi e ONT), demonstrando alto desempenho em benchmarks e aplicação clínica em casos de câncer.

Forsyth, R. A., Harbers, L., Verhasselt, A., Iraizos, A.-L. R., Yang, S., Vande Velde, J., Davies, C., Pillay, N., Lambrechts, L., Demeulemeester, J.2026-02-28💻 bioinformatics

Arborist: Prioritizing Bulk DNA Inferred Tumor Phylogenies via Low-pass Single-cell DNA Sequencing Data

O artigo apresenta o ARBORIST, um novo método que utiliza dados de sequenciamento de DNA de célula única de baixa cobertura para priorizar e refinar filogenias tumorais inferidas a partir de sequenciamento de DNA em massa, oferecendo uma abordagem integrada que supera os métodos individuais em precisão e resolução evolutiva.

Weber, L. L., Ching, C. Y., Ly, C., Pan, Y., Cheng, Y., Gao, C., Van Loo, P.2026-02-28💻 bioinformatics

Nanopore sequencing reaches amplicon sequence variant (ASV) resolution

Este estudo demonstra que, graças às recentes melhorias na precisão, a sequenciação de amplicons por Nanopore (ONT) permite agora a geração direta de Variantes de Sequência Amplicon (ASV) livres de erros em complexos ambientes microbianos, superando a dependência de bancos de dados de referência e viabilizando a resolução de variantes intragenômicas, embora exija uma profundidade de sequenciação significativamente maior do que a tecnologia PacBio, especialmente para amplicons longos.

Riisgaard-Jensen, M., Villanelo, S. A. R., Andersen, K. S., Kirkegaard, R., Hansen, S. H., Jiang, C., Stefansen, A. V., Thomsen, J. H. D., Nielsen, P. H., Dueholm, M. K. D.2026-02-28💻 bioinformatics

ESMRank reveals a transferable axis of protein mutational constraint from overlapping variant effect assays

O artigo apresenta o ESMRank, um preditor baseado em aprendizado de ordenação que integra representações de modelos de linguagem de proteínas com descritores físico-químicos, utilizando um novo framework de "sonoridade de variantes" para alinhar e agregar dados heterogêneos de ensaios de efeito de variantes, resultando em uma métrica de tolerância mutacional generalizável e mecanisticamente interpretável que supera métodos existentes na previsão de estabilidade, patogenicidade e função proteica.

Arnese, R., Gambardella, G.2026-02-28💻 bioinformatics