La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

From variability to consensus: rescoring harmonizes peptide identification across diverse search engines and datasets

Lo studio dimostra che le strategie avanzate di rescoring armonizzano l'identificazione dei peptidi tra diversi motori di ricerca e dataset, migliorando la robustezza e la comparabilità delle analisi proteomiche, sebbene richiedano un'attenta selezione delle caratteristiche e della scelta del database per garantire un controllo affidabile del FDR.

Winkelhardt, D., Berres, S., Uszkoreit, J.2026-03-06💻 bioinformatics

Phenotypic reversion and target prioritization for cellular inflammation via representation learning with foundation models

Questo studio presenta un framework basato su modelli foundation a singola cellula e dati Perturb-seq su larga scala che, integrando condizioni infiammatorie rilevanti per la malattia, identifica in modo efficace nuovi bersagli terapeutici per il ripristino fenotipico dell'infiammazione cellulare.

Wong, D. R., Piper, M., Qiao, J., Russo, M., Jean, P., Clevert, D.-A., Arroyo, J., Pashos, E.2026-03-06💻 bioinformatics

GWAS Summary Statistic Tool: A Meta-Analysis and Parsing Tool for Polygenic Risk Score Calculation

GWASPoker è uno strumento in Python che ottimizza la selezione e l'analisi preliminare delle statistiche riassuntive degli studi di associazione genome-wide (GWAS) dal Catalogo GWAS, consentendo di identificare automaticamente i file adatti per il calcolo dei punteggi di rischio poligenico (PRS) tramite download parziale e rilevamento degli intestazioni senza richiedere il trasferimento completo dei dati.

Muneeb, M. -, Ascher, D.2026-03-06💻 bioinformatics

Machine Learning Ensemble Reveals Distinct Molecular Pathways of Retinal Damage in Spaceflown Mice

Questo studio utilizza un ensemble di modelli di machine learning su dati trascrittomici di retina di topi esposti allo spazio per rivelare che lo stress ossidativo e l'apoptosi agiscono attraverso pathway molecolari distinti, fornendo un quadro fondamentale per lo sviluppo di biomarcatori e terapie volte a proteggere la salute visiva degli astronauti.

Casaletto, J. A., Scott, R. T., Rathod, A., Jain, A., Chandar, A., Adapala, A., Prajapati, A., Nautiyal, A., Jayaraman, A., Boddu, A., Kelam, A., Jain, A., Pham, B., Shastry, D., Narayanan, D., Kosara (…)2026-03-05💻 bioinformatics

Nested birth-death processes are competitive with parameter-heavy neural networks as time-dependent models of protein evolution

Questo studio dimostra che un modello di nascita-morte annidato basato sulla teoria evolutiva molecolare, pur utilizzando un numero di parametri drasticamente inferiore rispetto alle reti neurali, risulta competitivo nel modellare l'evoluzione delle proteine, suggerendo che l'integrazione di strutture matematiche fondate sulla teoria biologica possa migliorare l'efficienza e l'adeguatezza dei modelli filogenetici futuri.

Large, A., Holmes, I.2026-03-05💻 bioinformatics

Single-Cell Omics for Transcriptome CHaracterization (SCOTCH): isoform-level characterization of gene expression through long-read single-cell RNA sequencing

Il paper presenta SCOTCH, una pipeline end-to-end e indipendente dalla piattaforma per la caratterizzazione di isoformi a livello di singola cellula tramite sequenziamento RNA a lettura lunga, che migliora l'identificazione e la quantificazione degli isoformi noti e di quelli nuovi rispetto ai metodi esistenti.

Xu, Z., Qu, H.-Q., Mu, S., Kao, C., Hakonarson, H., Wang, K.2026-03-04💻 bioinformatics

Sample-specific haplotype-resolved protein isoform characterization via long-read RNA-seq-based proteogenomics

Gli autori sviluppano un flusso di lavoro proteogenomico end-to-end che integra dati di sequenziamento RNA a lettura lunga (lrRNA-seq) e spettrometria di massa per costruire database proteici risolti per aplotipo specifici del campione, permettendo così l'identificazione di isoforme proteiche, varianti e splicing non rilevabili con i proteomi di riferimento.

Wissel, D., Sheynkman, G. M., Robinson, M. D.2026-03-04💻 bioinformatics