La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

GWAS Summary Statistic Tool: A Meta-Analysis and Parsing Tool for Polygenic Risk Score Calculation

GWASPoker è uno strumento in Python che ottimizza la selezione e l'analisi preliminare delle statistiche riassuntive degli studi di associazione genome-wide (GWAS) dal Catalogo GWAS, consentendo di identificare automaticamente i file adatti per il calcolo dei punteggi di rischio poligenico (PRS) tramite download parziale e rilevamento degli intestazioni senza richiedere il trasferimento completo dei dati.

Muneeb, M. -, Ascher, D.2026-03-06💻 bioinformatics

Circular RNA identification using a genomic language model and a small number of authenticated examples

Il paper presenta circFormer, un approccio innovativo basato su un modello linguistico genomico e sull'apprendimento curricolare che supera la scarsità di dati di addestramento per identificare con alta precisione e interpretabilità le RNA circolari, confermando sperimentalmente la validità della maggior parte delle previsioni.

Li, K., Wang, W., Jiang, J., Deng, J., Zhang, J., Qiu, S., Zhang, W.2026-03-06💻 bioinformatics

Minimal Amino Acid Alphabet for Protein Design

Lo studio dimostra che, sebbene gli alfabeti di amminoacidi ridotti rendano difficile la formazione di strutture complesse, è possibile progettare e validare sperimentalmente proteine globulari stabili utilizzando un insieme minimo di otto amminoacidi, suggerendo che tali proteine potrebbero essersi evolute precocemente e offrendo nuove prospettive per la biotecnologia.

Pubal, K., Kushnir, K., Spiwok, V., Louzecka, K., Setnicka, V., Lipovova, P.2026-03-06💻 bioinformatics

Machine Learning Ensemble Reveals Distinct Molecular Pathways of Retinal Damage in Spaceflown Mice

Questo studio utilizza un ensemble di modelli di machine learning su dati trascrittomici di retina di topi esposti allo spazio per rivelare che lo stress ossidativo e l'apoptosi agiscono attraverso pathway molecolari distinti, fornendo un quadro fondamentale per lo sviluppo di biomarcatori e terapie volte a proteggere la salute visiva degli astronauti.

Casaletto, J. A., Scott, R. T., Rathod, A., Jain, A., Chandar, A., Adapala, A., Prajapati, A., Nautiyal, A., Jayaraman, A., Boddu, A., Kelam, A., Jain, A., Pham, B., Shastry, D., Narayanan, D., Kosara (…)2026-03-05💻 bioinformatics

Nested birth-death processes are competitive with parameter-heavy neural networks as time-dependent models of protein evolution

Questo studio dimostra che un modello di nascita-morte annidato basato sulla teoria evolutiva molecolare, pur utilizzando un numero di parametri drasticamente inferiore rispetto alle reti neurali, risulta competitivo nel modellare l'evoluzione delle proteine, suggerendo che l'integrazione di strutture matematiche fondate sulla teoria biologica possa migliorare l'efficienza e l'adeguatezza dei modelli filogenetici futuri.

Large, A., Holmes, I.2026-03-05💻 bioinformatics

Towards building a World Model to simulate perturbation-induced cellular dynamics by AlphaCell

Il paper presenta AlphaCell, un modello generativo di "mondo cellulare virtuale" che supera i limiti delle simulazioni attuali integrando l'intero trascrittoma codificante per proteine, ricostruendo profili di espressione genomici ad alta fedeltà e modellando le dinamiche cellulari indotte da perturbazioni attraverso campi vettoriali deterministici, consentendo così previsioni robuste e generalizzabili in contesti cellulari mai visti.

Chuai, G., Chen, X., Yang, X., Zhang, C., Qu, K., Wang, Y., Li, W., Yang, J., Si, D., Xing, F., Gao, Y., Wu, S., Fu, S., He, B., Liu, Q.2026-03-05💻 bioinformatics