A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

Structure-informed Siamese graph neural networks classify CirA missense variants with implications for cefiderocol susceptibility

Este estudo apresenta uma rede neural gráfica siamesa informada por estrutura, treinada em dados sintéticos derivados do modelo AlphaFold, para classificar variantes de missense da proteína CirA e prever seu impacto na suscetibilidade ao cefiderocol em Enterobacterales, superando a falta de grandes conjuntos de dados experimentais.

Razavi, M., Tellapragada, C., Giske, C. G.2026-04-21💻 bioinformatics

Epigenetically constrained astrocyte states underlie prefrontal cortex vulnerability in Down syndrome associated Alzheimer disease

Este estudo identifica que a vulnerabilidade do córtex pré-frontal na doença de Alzheimer associada à síndrome de Down é impulsionada por um estado epigeneticamente restrito de astrócitos basais, caracterizado pela perda de funções homeostáticas e pela incapacidade de responder adequadamente a sinais inflamatórios e de estresse.

Sun, C., Thomas, R., Stringer, C., Galani, K., Ho, L.-L., Sun, N., Renfro, A., Wright, S., Firenze, R., Tsai, L.-H., Head, E., Kellis, M., Yang, J.2026-04-21💻 bioinformatics

3D Reconstruction of Nanoparticle Distribution in Tumor Spheroids with Volume Electron Microscopy

Este estudo apresenta um pipeline analítico integrado que combina microscopia eletrônica de volume e segmentação híbrida para reconstruir em 3D a distribuição de nanopartículas em esferoides tumorais, revelando seu agrupamento preferencial perinuclear e fornecendo um framework reprodutível para análise quantitativa conjunta de morfologia celular e destino de nanomateriais.

Bottone, D., Gerken, L. R., Habermann, S., Mateos, J. M., Lucas, M. S., Riemann, J., Fachet, M., Resch-Genger, U., Kissling, V. M., Roesslein, M., Gogos, A., Herrmann, I. K.2026-04-21💻 bioinformatics

Benchmarking Generative Large Language Models for de novo Antibody Design and Agentic Evaluation

Este estudo demonstra que, na escala de modelos compactos treinados do zero para o design de anticorpos, a arquitetura específica da família do LLM tem impacto insignificante na qualidade estrutural e funcional dos candidatos gerados, sendo o desempenho determinado principalmente pelo volume dos dados de treinamento e pela escala do modelo, validado por uma nova pipeline de avaliação agêntica.

Hossain, D., Abir, F. A., Zhang, S., Chen, J. Y.2026-04-21💻 bioinformatics

DNAharvester: A Nextflow Pipeline for Analysing Highly Degraded DNA from Ancient and Historical Specimens

O artigo apresenta o DNAharvester, um pipeline modular e reprodutível desenvolvido em Nextflow para processar DNA altamente degradado de espécimes antigos e históricos, integrando estratégias avançadas de filtragem, mapeamento competitivo e chamada de variantes para maximizar a recuperação de dados autênticos e mitigar contaminações.

Sharif, B., Kutschera, V. E., Oskolkov, N., Guinet, B., Lord, E., Chacon-Duque, J. C., Oppenheimer, J., van der Valk, T., Diez-del-Molino, D., D. Heintzman, P., Dalen, L.2026-04-21💻 bioinformatics

Understanding Language Model Scaling on Protein Fitness Prediction

Este estudo revela que, ao contrário da crença comum no campo de aprendizado profundo, o aumento excessivo do tamanho dos modelos de linguagem de proteínas pode prejudicar a previsão de aptidão, pois modelos maiores tendem a gerar probabilidades de sequência extremas que não refletem adequadamente os padrões evolutivos, indicando que o desempenho ideal ocorre em um nível moderado de probabilidade.

Hou, C., Liu, D., Zafar, A., Shen, Y.2026-04-20💻 bioinformatics

Natively entangled proteins are linked to human disease and pathogenic mutations likely due to a greater misfolding propensity

Este estudo demonstra que proteínas humanas nativamente emaranhadas possuem uma maior propensão ao mau enovelamento, o que as torna significativamente mais suscetíveis a doenças e mutações patogênicas, sugerindo assim um novo mecanismo de perda de função e um espaço promissor para o desenvolvimento de terapias.

Anglero Mendez, M. F., Sitarik, I., Vu, Q. V., Totoo, P., Stephenson, J. D., Song, H., O'Brien, E. P.2026-04-20💻 bioinformatics

Genome-wide identification and characterization of the NAC transcription factor family in Cynodon dactylon and their expression during abiotic stresses

Este estudo realiza a primeira caracterização abrangente da família de fatores de transcrição NAC em *Cynodon dactylon*, identificando 237 genes e demonstrando que muitos deles, especialmente os da classe SNAC, desempenham papéis regulatórios distintos e essenciais na resposta a estresses abióticos como seca, calor, salinidade e submersão.

Poudel, A., Wu, Y.2026-04-20💻 bioinformatics

Truthful visualizations for mass spectrometry imaging enable high spatial resolution interactive m/z mapping and exploration

O artigo apresenta o MSI-VISUAL, um framework de código aberto que utiliza estratégias de visualização verdadeiras e otimizadas para permitir a exploração interativa de alta resolução de dados de imagem por espectrometria de massa, superando métodos existentes na preservação da estrutura global e na descoberta de padrões moleculares sutis.

Gildenblat, J., Pahnke, J.2026-04-19💻 bioinformatics

Longitudinal Phylogenetic Inference of Copy Number Alterations and Single Nucleotide Variants from Single-Cell Sequencing

O artigo apresenta o LoPhy, um novo método computacional que reconstrói a evolução longitudinal de mutações de nucleotídeo único e alterações no número de cópias em células individuais de leucemia mieloide aguda, permitindo uma compreensão mais precisa da progressão da doença e da resistência terapêutica.

Kulman, E., Kuang, R., Morris, Q.2026-04-19💻 bioinformatics