bioinformatics articoli

La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

ITSxRust: ITS region extraction with partial-chain recovery and structured diagnostics for long-read amplicon sequencing

Il paper presenta ITSxRust, un estrattore ITS scritto in Rust ottimizzato per il sequenziamento a letture lunghe che, grazie a strategie di recupero parziale e diagnostica strutturata, supera le prestazioni di ITSx e ITSxpress in termini di velocità e tasso di estrazione completa o parziale delle regioni ITS.

O'Brien, A., Lagos, C., Fernandez, K., Parada, P.2026-02-26💻 bioinformatics

POTTR: Identifying Recurrent Trajectories in Evolutionary and Developmental Processes using Posets

Il paper presenta POTTR, un nuovo algoritmo combinatorio basato sui posets parzialmente ordinati che risolve il problema NP-difficile di identificare le traiettorie di mutazioni ricorrenti massime in processi evolutivi e di sviluppo biologico, superando l'incertezza nelle filogenesi tumorali e applicandosi con successo a dati di sequenziamento del cancro e di tracciamento di lignaggi embrionali.

Käufler, S. C., Schmidt, H., Jürgens, M., Klau, G. W., Sashittal, P., Raphael, B.2026-02-26💻 bioinformatics

MaxGeomHash: An Algorithm for Variable-Size Random Sampling of Distinct Elements

Questo articolo presenta MaxGeomHash, un nuovo algoritmo di sketching parallelo e invariante per permutazione che genera campioni casuali di dimensioni variabili e sub-lineari per l'analisi efficiente e accurata di grandi dataset di k-mers biologici, colmando il divario tra le tecniche di dimensione fissa (MinHash) e quelle lineari (FracMinHash).

Hera, M. R., Koslicki, D., Martinez, C.2026-02-25💻 bioinformatics

PMGen: From Peptide-MHC Structure Prediction to Peptide Generation

Il paper presenta PMGen, un framework integrato che utilizza strategie avanzate su AlphaFold2 per prevedere con alta precisione le strutture di complessi peptide-MHC di lunghezza variabile e guidare la progettazione razionale di peptidi e la generazione di dati per modelli di apprendimento automatico in immunologia.

Asgary, A. H., Aleyasin, A., Mehl, J. A., Fallah, S., Aintablian, H., Ludewig, B., Mishto, M., Liepe, J., Soeding, J.2026-02-25💻 bioinformatics

PaNDA: Efficient Optimization of Phylogenetic Diversity in Networks

Il paper introduce PaNDA, un nuovo software che offre il primo algoritmo efficiente in tempo polinomiale per massimizzare la diversità filogenetica in reti con scanwidth limitata, superando le limitazioni computazionali delle reti filogenetiche rispetto agli alberi tradizionali.

Holtgrefe, N., van Iersel, L., Meuwese, R., Murakami, Y., Schestag, J.2026-02-25💻 bioinformatics

Protein Compositional Ratio Representation (PCRR)Systematically Improves Human Disease Prediction

Questo studio dimostra che rappresentare i dati proteomici plasmatici come rapporti composti tra proteine, piuttosto che come valori di abbondanza assoluta, migliora significativamente la predizione delle malattie umane, inclusa l'Alzheimer, catturando più fedelmente i vincoli biochimici sottostanti.

Madduri, A. V., Ellis, R. J., Patel, C. J.2026-02-25💻 bioinformatics

KuPID: Kmer-based Upstream Preprocessing of Long Reads forIsoform Discovery

Il paper introduce KuPID, un metodo di pre-elaborazione basato su kmer per letture RNAseq lunghe che accelera e migliora l'accuratezza della scoperta di nuovi isoformi filtrando le letture non rilevanti prima dell'allineamento completo.

Borowiak, M., Yu, Y. W.2026-02-25💻 bioinformatics

GaugeFixer: overcoming parameter non-identifiability in models of sequence-function relationships

Il paper introduce GaugeFixer, un pacchetto Python che risolve il problema della non identificabilità dei parametri nei modelli di relazioni sequenza-funzione sfruttando una struttura matematica specifica per ottenere una scalabilità lineare, rendendo così fattibile l'interpretazione biologica di landscape di fitness complessi con milioni di parametri.

Marti-Gomez, C., McCandlish, D. M., Kinney, J. B.2026-02-25💻 bioinformatics

Generating Structurally Diverse Therapeutic Peptides with GFlowNet

Il paper propone l'uso di GFlowNet per la generazione di peptidi terapeutici, dimostrando che il campionamento proporzionale alla ricompensa garantisce una diversità strutturale intrinseca e robusta, superando il problema del collasso modale tipico degli approcci di reinforcement learning tradizionali.

Wijaya, E.2026-02-25💻 bioinformatics

Distilling Protein Language Models with Complementary Regularizers

Questo studio dimostra che la distillazione di un grande modello linguistico proteico in studenti compatti, potenziata da due regolarizzatori complementari basati sull'incertezza e sulla calibrazione, permette di ottenere modelli più veloci ed efficienti che, pur essendo ridotti, superano il modello originale nella generazione di sequenze familiari quando addestrati su dati scarsi.

Wijaya, E.2026-02-25💻 bioinformatics

← Precedente Successivo →