A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Decoding conformational heterogeneity across disordered proteomes

O estudo apresenta o AI-IDP, uma nova estrutura de aprendizado profundo que decodifica a heterogeneidade conformacional de proteínas intrinsecamente desordenadas ao gerar conjuntos estruturais consistentes com dados experimentais, revelando como características evolutivas como hélices transitórias e conformações poli-prolina II são fundamentais para a função e o direcionamento terapêutico dessas proteínas.

Abyzov, A., Zweckstetter, M.2026-03-16💻 bioinformatics

PepCABO: Latent-space Bayesian optimization for peptide-MHC binding using contrastive alignment

O artigo apresenta o PepCABO, um framework de otimização bayesiana no espaço latente que utiliza alinhamento contrastivo e um autoencoder variacional duplo para otimizar eficientemente a ligação de peptídeos a alelos de MHC, superando métodos existentes ao permitir transferência de conhecimento estruturada e maior eficiência amostral.

Ghane, M., Korpela, D., Dumitrescu, A., Lähdesmäki, H.2026-03-16💻 bioinformatics

Introducing non-enzymatic crosslinks into atomistic simulations of collagen fibrils

Os autores apresentam uma extensão da ferramenta ColBuilder que permite a geração de modelos atômicos de fibrilas de colágeno incorporando ligações cruzadas não enzimáticas (AGEs), fornecendo parâmetros de simulação validados e demonstrando como essas ligações afetam diferentemente a estrutura mecânica das fibrilas em comparação com as ligações enzimáticas.

Giannetti, G., Pils, J., Graeter, F., Monego, D., Dellago, C.2026-03-16💻 bioinformatics

Survey of the human proteostasis network: the ubiquitin-proteasome system

Este artigo apresenta um levantamento abrangente do sistema ubiquitina-proteassoma (UPS) e da rede de proteostase humana, estimando que o UPS envolve mais de 1400 proteínas e a rede total mais de 3100 componentes, fornecendo uma base essencial para pesquisas em genômica, proteômica e doenças.

Elsasser, S., Powers, E., Stoeger, T., Sui, X., Kurtzbard, R. D., Martinez-Botia, P., Wangaline, M. A., Gama, A. R., Huttlin, E. L., Elia, L. P., Kelly, J. W., Gestwicki, J. E., Frydman, J. E., Finkbe (…)2026-03-16💻 bioinformatics

LysinFusion: Integrating Multi-Feature Encoding and Hybrid CNN-Transformer Architecture for Phage Lysin Prediction

O artigo apresenta o LysinFusion, um novo framework de aprendizado profundo que combina codificação de características heterogêneas e uma arquitetura híbrida CNN-Transformer para identificar lisinas de bacteriófagos com maior precisão e reprodutibilidade do que métodos existentes, superando a ferramenta DeepMineLys em benchmarks independentes.

He, S., Lu, H., Yao, Z., Cai, Y., Zhou, F., Feng, X., Cai, Y., Li, F.2026-03-16💻 bioinformatics

Machine Learning Reveals Intrinsic Determinants of siRNA Efficacy

Este estudo apresenta um modelo de aprendizado de máquina que prevê a eficácia de siRNAs diretamente a partir de características intrínsecas da sequência, identificando nucleotídeos específicos nas extremidades como os principais determinantes e oferecendo uma ferramenta mais precisa e interpretável para o desenho racional de siRNAs em aplicações terapêuticas e agrícolas.

Mandelli, C., Crippa, G., Jali, S.2026-03-15💻 bioinformatics

Scaling the PBWT for Long-Range Shared Ancestry Detection in Large Haplotype Panels

O artigo apresenta o PBML, um novo algoritmo que utiliza o índice PBWT comprimido para identificar eficientemente apenas correspondências exatas máximas conjuntas (kL-SMEMs) longas e compartilhadas por múltiplas haplótipos, superando significativamente os métodos atuais em velocidade e escalabilidade para a detecção de ancestralidade compartilhada em grandes painéis genéticos.

Islam, U. I., Cozzi, D., Gagie, T., Varki, R., Colonna, V., Garrison, E., Bonizzoni, P., Boucher, C.2026-03-15💻 bioinformatics

Bayesian AMMI-Based Simulation of Genotype x Environment Interactions

Este artigo propõe e valida um quadro de simulação de interação genótipo-ambiente (GEI) baseado no modelo AMMI Bayesiano, que utiliza matrizes de covariância ambiental de alto rendimento para gerar efeitos GEI com estrutura direcional interpretável, demonstrando sua superioridade na captura de respostas específicas dos genótipos e na melhoria das estratégias de seleção genômica em comparação com simulações tradicionais.

Lee, H., Segae, V. S., Garcia-Abadillo, J., de Oliveira Bussiman, F., Trujano Chavez, M. Z., Hidalgo, J., Jarquin, D.2026-03-15💻 bioinformatics