bioinformatics artigos | Gist.Science

A bioinformática une biologia e computação para desvendar os mistérios da vida através de dados. Nesta área, pesquisadores transformam sequências genéticas complexas em informações compreensíveis, permitindo descobertas rápidas sobre doenças, evolução e tratamentos personalizados sem depender apenas de laboratórios físicos.

No Gist.Science, processamos diariamente cada novo pré-publicação na categoria de bioinformática enviada pelo bioRxiv. Nosso compromisso é tornar esse conhecimento acessível, oferecendo tanto resumos em linguagem simples para o público geral quanto análises técnicas detalhadas para especialistas, garantindo que ninguém fique de fora das últimas inovações científicas.

Abaixo, você encontrará as últimas pesquisas publicadas nesta área, organizadas para facilitar sua leitura e compreensão dos avanços recentes.

ITSxRust: ITS region extraction with partial-chain recovery and structured diagnostics for long-read amplicon sequencing

O artigo apresenta o ITSxRust, uma ferramenta em Rust para extração de regiões ITS em dados de sequenciamento de longa leitura, que supera as ferramentas ITSx e ITSxpress em velocidade e precisão ao empregar estratégias de recuperação de cadeias parciais e diagnósticos estruturados.

O'Brien, A., Lagos, C., Fernandez, K., Parada, P.2026-02-26💻 bioinformatics

POTTR: Identifying Recurrent Trajectories in Evolutionary and Developmental Processes using Posets

O artigo apresenta o POTTR, um novo algoritmo baseado em conjuntos parcialmente ordenados incompletos para identificar trajetórias recorrentes de mutações genéticas em processos evolutivos e de desenvolvimento, superando a incerteza nas filogenias tumorais e validando sua eficácia em dados de câncer e modelos de embriogênese.

Käufler, S. C., Schmidt, H., Jürgens, M., Klau, G. W., Sashittal, P., Raphael, B.2026-02-26💻 bioinformatics

MaxGeomHash: An Algorithm for Variable-Size Random Sampling of Distinct Elements

Este artigo apresenta o MaxGeomHash, um novo algoritmo de sketching que gera amostras aleatórias de tamanho variável e sublinear para conjuntos de k-mers, oferecendo um equilíbrio otimizado entre eficiência computacional e precisão na estimativa de similaridade biológica, superando métodos existentes como MinHash e FracMinHash.

Hera, M. R., Koslicki, D., Martinez, C.2026-02-25💻 bioinformatics

PMGen: From Peptide-MHC Structure Prediction to Peptide Generation

O artigo apresenta o PMGen, um quadro integrado que utiliza AlphaFold2 modificado para prever com alta precisão as estruturas de complexos peptídeo-MHC de classes I e II, permitindo o design guiado por estrutura de peptídeos e a geração de dados de alta qualidade para treinar modelos de aprendizado de máquina em imunologia.

Asgary, A. H., Aleyasin, A., Mehl, J. A., Fallah, S., Aintablian, H., Ludewig, B., Mishto, M., Liepe, J., Soeding, J.2026-02-25💻 bioinformatics

PaNDA: Efficient Optimization of Phylogenetic Diversity in Networks

O artigo apresenta o PaNDA, um software inovador que inclui um algoritmo de tempo polinomial para maximizar a diversidade filogenética em redes filogenéticas com scanwidth limitado, superando as limitações computacionais de métodos anteriores e oferecendo uma interface gráfica para análise de dados genômicos reais e simulados.

Holtgrefe, N., van Iersel, L., Meuwese, R., Murakami, Y., Schestag, J.2026-02-25💻 bioinformatics

Protein Compositional Ratio Representation (PCRR)Systematically Improves Human Disease Prediction

Este estudo demonstra que representar dados proteômicos como razões composicionais entre proteínas, em vez de valores absolutos, melhora significativamente a precisão na previsão de doenças humanas, incluindo o Alzheimer, ao capturar melhor as relações bioquímicas subjacentes e os desequilíbrios funcionais.

Madduri, A. V., Ellis, R. J., Patel, C. J.2026-02-25💻 bioinformatics

KuPID: Kmer-based Upstream Preprocessing of Long Reads forIsoform Discovery

O artigo apresenta o KuPID, uma ferramenta de pré-processamento baseada em k-mers para leituras longas de RNAseq que acelera a descoberta de novos isoformas ao filtrar rapidamente leituras irrelevantes, aumentando a precisão e reduzindo o tempo de execução em pipelines de análise.

Borowiak, M., Yu, Y. W.2026-02-25💻 bioinformatics

GaugeFixer: overcoming parameter non-identifiability in models of sequence-function relationships

O artigo apresenta o GaugeFixer, um pacote em Python que resolve o problema de não identificabilidade de parâmetros em modelos de relações sequência-função com escalabilidade linear, permitindo a interpretação biológica de paisagens de aptidão complexas com milhões de parâmetros.

Marti-Gomez, C., McCandlish, D. M., Kinney, J. B.2026-02-25💻 bioinformatics

Generating Structurally Diverse Therapeutic Peptides with GFlowNet

O artigo propõe o uso de GFlowNet para a geração de peptídeos terapêuticos, demonstrando que sua abordagem de amostragem proporcional à recompensa supera os métodos tradicionais de aprendizado por reforço ao evitar o colapso de modos e garantir uma diversidade estrutural intrínseca sem penalidades explícitas.

Wijaya, E.2026-02-25💻 bioinformatics

Distilling Protein Language Models with Complementary Regularizers

Os autores demonstram que a destilação de um grande modelo de linguagem de proteínas em modelos menores, utilizando regularizadores complementares específicos para proteínas (ponderação de posição consciente da incerteza e suavização de rótulos consciente da calibração), resulta em modelos mais rápidos, leves e eficientes em termos de amostragem, que superam o modelo professor na adaptação a dados escassos.

Wijaya, E.2026-02-25💻 bioinformatics

← Anterior Próximo →