A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Systematic contextual biases in SegmentNT potentially relevant to other nucleotide transformer models

Este artigo identifica e caracteriza vieses contextuais sistemáticos no modelo de transformador de nucleotídeos SegmentNT — especificamente em relação ao comprimento da sequência de entrada, à posição do nucleotídeo e a uma oscilação periódica de 24 nucleotídeos vinculada à tokenização — e propõe métodos de padronização para melhorar a consistência das previsões e orientar o uso de modelos genômicos semelhantes.

Ebbert, M. T. W., Ho, A., Page, M. L., Dutch, B., Byer, B. K., Hankins, K. L., Sabra, H., Aguzzoli Heberle, B., Wadsworth, M. E., Fox, G. A., Karki, B., Hickey, C., Fardo, D. W., Bumgardner, C., Jakub (…)2026-05-05💻 bioinformatics

MilliMap: interactive closed-loop analysis for spatial omics

O MilliMap é um framework interativo que unifica o cálculo estatístico e a exploração espacial para permitir uma análise iterativa em ciclo fechado de dados de ômica espacial, permitindo que pesquisadores refinem parâmetros e validem descobertas dentro de um único ambiente para aplicações que vão desde a neuroanatomia até microambientes tumorais.

Feng, Q., Qian, S. B., Wan, J., Starr, Z. R., Asif, S., Han, H.-S.2026-05-05💻 bioinformatics

SenNet Portal: Build, Optimization and Usage

Este artigo apresenta o Portal de Dados SenNet, uma plataforma híbrida escalável em nuvem que fornece acesso aberto a conjuntos de dados multimodais e multitecido harmonizados e a ferramentas analíticas para caracterizar sistematicamente a senescência celular em modelos humanos e de camundongos para pesquisa sobre envelhecimento.

Borner, K., Blood, P. D., Silverstein, J. C., Ruffalo, M., Satija, R., Gehlenborg, N., Honick, B., Bueckle, A., Jain, Y., Qaurooni, D., Shirey, B., Sibilla, M., Metis, K., Bisciotti, J., Morgan, R. S. (…)2026-05-04💻 bioinformatics

Do Larger Models Really Win in Drug Discovery?A Benchmark Assessment of Model Scaling in AI-Driven Molecular Property and Activity Prediction

Este estudo de referência desafia a premissa de que modelos de IA maiores superam universalmente os menores na descoberta de fármacos, demonstrando que modelos compactos e especializados frequentemente alcançam precisão preditiva superior ou comparável em diversas tarefas de propriedades e atividades moleculares em comparação com grandes modelos fundamentais.

Guo, J.2026-05-04💻 bioinformatics

AnnotateMissense: a genome-wide annotation and benchmarking framework for missense pathogenicity prediction

AnnotateMissense é uma estrutura escalável que integra recursos diversos de genômica e de modelos de linguagem de proteínas para avaliar e gerar previsões de patogenicidade de alto desempenho para mais de 90 milhões de variantes missense, alcançando precisão superior com um modelo XGBoost treinado em 132.714 variantes rotuladas pelo ClinVar.

Muneeb, M., Ascher, D. B.2026-05-04💻 bioinformatics

AI-guided discovery of atypical protein assemblies

Os autores desenvolveram o Índice de Novidade Estrutural (SNI), um framework impulsionado por IA que identificou com sucesso e validou experimentalmente uma montagem inesperada de receptores imunes NRC em undecâmero, demonstrando um método escalável para a descoberta de complexos proteicos atípicos além das arquiteturas canônicas.

Toghani, A., Seager, B. A., Sugihara, Y., Roijen, L.-M., Azcue, J. M., Garro, M., Sargolzaei, M., Morianou, I., Harant, A., Gallop, S., Kourelis, J., MacLean, D., Contreras, M. P., Kamoun, S., Lüdke (…)2026-05-04💻 bioinformatics

A 37-million-particle dataset from over 250 experiments to accelerate data-driven cryo-EM analysis

O artigo apresenta o cryoPANDA, um conjunto massivo de dados com mais de 37 milhões de partículas de criomicroscopia eletrônica anotadas provenientes de 252 experimentos diversos, concebido para superar as limitações atuais de dados e acelerar o desenvolvimento de métodos orientados por dados para a biologia estrutural.

Zamanos, A., Kyrilis, F. L., Koromilas, P., Kastritis, P. L., Panagakis, Y.2026-05-03💻 bioinformatics

Modeling healthy proteomic profiles for anomaly detection using subspace learning based one-class classification

Este artigo apresenta um framework de classificação de uma única classe em subespaço totalmente baseado em dados que modela perfis proteômicos de plasma saudáveis para detectar robustamente diversas doenças sem exigir amostras de treinamento doentes, superando assim os desafios de desequilíbrio de classes em dados clínicos de alta dimensão.

Sohrab, F., Kumar, A., Ahola, V., Magis, A., Hautamaki, V., Heinaniemi, M., Huang, S.2026-05-01💻 bioinformatics

Hierarchical Breakdown of RNA Structure Prediction in CASP16: From Reliable Local Features to Speculative Multimer Assembly

Este artigo apresenta um estudo de caso do CASP16 realizado pelo LCBio, demonstrando que, embora fluxos de trabalho guiados por especialistas possam alcançar classificações competitivas na previsão de multímeros de RNA, os métodos atuais exibem um declínio hierárquico na precisão, em que características locais confiáveis não se traduzem em arquiteturas globais precisas devido a desafios persistentes na modelagem de junções de múltiplas hélices e interações não canônicas.

Nithin, C., Pilla, S. P., Kmiecik, S.2026-04-30💻 bioinformatics