A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Pioneer and Altimeter: Fast Analysis of DIA Proteomics Data Optimized for Narrow Isolation Windows

O artigo apresenta o Pioneer e o Altimeter, ferramentas de código aberto que otimizam a análise rápida e precisa de dados de proteômica DIA em janelas de isolamento estreitas, modelando explicitamente efeitos de isótopos para permitir reutilização de bibliotecas espectrais e acelerar o processamento em 2 a 6 vezes sem comprometer o controle da taxa de descoberta falsa.

Wamsley, N. T., Wilkerson, E. M., Major, M. B., Goldfarb, D.2026-02-19💻 bioinformatics

Experimental Time Points Guided Transcriptomic Velocity Inference

O artigo apresenta o CellDyc, uma nova estrutura de aprendizado semi-supervisionado que integra pontos de tempo experimentais para inferir velocidades transcriptômicas e recuperar um tempo intrínseco, superando métodos existentes na reconstrução precisa de trajetórias celulares em diversos contextos biológicos.

Zang, X., Shu, X., Zhang, N., Wu, Y., Deng, M., Zhou, X., Yang, J., Zhang, C.-Y., Wang, X., Zhou, Z., Wang, J.2026-02-19💻 bioinformatics

Identification of an ERCC2 mutation associated mutational signature of nucleotide excision repair deficiency in targeted panel sequencing data

Este estudo desenvolve e valida uma assinatura mutacional composta baseada em sequenciamento de painéis direcionados para identificar deficiências no reparo por excisão de nucleotídeos causadas por mutações no ERCC2, demonstrando que essa assinatura prediz melhor resposta à terapia com platina e sobrevida em pacientes com câncer de bexiga, além de sugerir sua aplicabilidade em outros tipos de tumores sólidos.

Stojkova, O., Borcsok, J., Sztupinszki, Z., Diossy, M., Prosz, A., Neil, A., Mouw, K. W., Sorensen, C. S., Szallasi, Z.2026-02-19💻 bioinformatics

NanoHIVSeq: A Long-Read Bioinformatics Pipeline for High-Throughput Processing of HIV Env Sequences

O artigo apresenta o NanoHIVSeq, um pipeline de bioinformática sem UMIs e sem referência que processa dados de sequenciamento de longa leitura do Oxford Nanopore para recuperar variantes funcionais completas do gene Env do HIV com alta precisão e reprodutibilidade, simplificando a preparação de bibliotecas para estudos de grandes coortes.

Sheng, Z., Xiao, Q., Qiao, Y., Lu, H., McWhirter, J., Sagar, M., Wu, X.2026-02-19💻 bioinformatics

Benchmarking Large Language Models for Predicting Therapeutic Antisense Oligonucleotide Efficacy

Este estudo avalia o desempenho de diversos Grandes Modelos de Linguagem (LLMs) na previsão da eficácia terapêutica de oligonucleotídeos antisense, demonstrando que a abordagem de engenharia de prompts utilizando sequências de DNA e informações de genes-alvo supera a representação baseada em SMILES, com o modelo GPT-3.5-Turbo alcançando os melhores resultados em cenários de aprendizado com poucos exemplos.

Wei, Z., Griesmer, S., Sundar, A.2026-02-19💻 bioinformatics

A Machine Learning and Benchmarking Approach for Molecular Formula Assignment of Ultra High-Resolution Mass Spectrometry Data from Complex Mixtures

Este artigo apresenta uma abordagem baseada em aprendizado de máquina, utilizando algoritmos como KNN, DTR e RFR, que supera os métodos tradicionais na atribuição de fórmulas moleculares a dados de espectrometria de massa de ultra-alta resolução de misturas complexas, aumentando significativamente o número de fórmulas anotadas e disponibilizando um novo conjunto de dados e código como referência para o campo.

Shabbir, B., Oliveira, P. B., Fernandez-Lima, F., Saeed, F.2026-02-19💻 bioinformatics

ModCRElib: A standalone package to model cis-regulatory elements.

O artigo apresenta o ModCRElib, um pacote independente que oferece ferramentas para analisar e modelar interações entre fatores de transcrição e DNA, permitindo prever motivos de ligação, perfis de afinidade e estruturas de complexos regulatórios de ordem superior através de dados estruturais.

Gohl, P., Fornes, O., Bota, P. M., Messeguer, A., Bonet, J., Molina-Fernandez, R., Planas-Iglesias, J., Hernandez, A. C., Gallego, O., Fernandez-Fuentes, N., Oliva, B.2026-02-19💻 bioinformatics

A single-cell atlas linking intratumoral states to therapeutic vulnerabilities across cancers

Este estudo apresenta o Therapeutic Cancer Cell Atlas (TCCA), um recurso pan-canceroso de células únicas que integra aproximadamente 1,8 milhão de transcriptomas para mapear a heterogeneidade terapêutica e identificar vulnerabilidades a medicamentos baseadas em programas transcricionais funcionais e estados do microambiente tumoral, oferecendo um quadro escalável para orientar estratégias de oncologia de precisão.

Gonzalez-Bermejo, M., Serrano-Ron, L., Garcia-Martin, S., Lapuente-Santana, O., Sanz-Portillo, I., Gonzalez-Martinez, P., Gomez-Lopez, G., Al-Shahrour, F.2026-02-19💻 bioinformatics