A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

Este estudo apresenta o maior atlas de transcriptômica de células únicas harmonizado do macaco-prego (*Macaca fascicularis*), integrado a um modelo de fundação humana, que fornece um recurso unificado para melhorar a qualificação de alvos terapêuticos, a interpretação de toxicidade e a redução do uso de primatas não humanos na pesquisa pré-clínica.

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics

ProteinSage: From implicit learning to explicit structural constraints for efficient protein language modeling

O artigo apresenta o ProteinSage, um novo framework de pré-treinamento que utiliza restrições estruturais explícitas para aprender representações de proteínas mais eficientes e generalizáveis com menos dados, demonstrando sua eficácia na descoberta de novos homólogos de rodopsina microbiana.

Shen, L., Chao, L., Liu, T., Liu, Q., Zhou, G., Wang, H., Dong, X., Li, T., Zhang, X., Ni, J.2026-03-19💻 bioinformatics

evedesign: accessible biosequence design with a unified framework

O artigo apresenta o evedesign, um framework de código aberto e unificado que torna acessível e interoperável o design de biosequências condicionais e multiobjetivo, permitindo a integração de modelos de aprendizado de máquina diversos em fluxos de trabalho iterativos e oferecendo uma interface web interativa para engenheiros de proteínas.

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

Este estudo desenvolveu um fluxo de trabalho robusto que combina busca por palavras-chave, Modelos Ocultos de Markov e alinhamento estrutural para identificar, classificar e reanotar consistentemente 1.513 depósitos de Citocromo P450 no Banco de Dados de Proteínas, resultando no primeiro registro curado e estruturado dessa superfamília com nomenclatura padronizada.

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

SELFormerMM: multimodal molecular representation learning via SELFIES, structure, text, and knowledge graph integration

O artigo apresenta o SELFormerMM, um framework de aprendizado multimodal que integra notações SELFIES, estruturas moleculares, descrições textuais e dados de redes de conhecimento biológico para gerar representações moleculares mais ricas e superar modelos unimodais em tarefas de predição de propriedades.

Ulusoy, E., Bostanci, S., Deniz, B. E., Dogan, T.2026-03-19💻 bioinformatics

Super Bloom: Fast and precise filter for streaming k-mer queries

Este trabalho apresenta o Super Bloom Filter, uma estrutura de filtro de Bloom otimizada para consultas de k-mers em fluxo contínuo que utiliza minimizadores e o esquema findere para agrupar k-mers adjacentes em blocos de memória, resultando em uma melhoria significativa na eficiência de cache, velocidade de processamento e precisão na redução de falsos positivos em comparação com implementações existentes.

Conchon-Kerjan, E., Rouze, T., Robidou, L., Ingels, F., Limasset, A.2026-03-19💻 bioinformatics