La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Evaluating Limits of Machine Learning-Assisted Raman Spectroscopy in Classification of Biological Samples

Questo studio dimostra che, nella spettroscopia Raman assistita da machine learning per la classificazione di campioni biologici, la qualità dei dati e la similarità spettrale sono i fattori determinanti per l'accuratezza, superando l'impatto degli algoritmi stessi e richiedendo un rigoroso controllo sperimentale e una calibrazione strumentale per gestire la variabilità biologica e garantire risultati affidabili.

Yadav, A., Birkby, A., Armstrong, N., Arnob, A., Chou, M.-H., Fernandez, A., Verhoef, A. J., Yi, Z., Gulati, S., Kotnis, S., Sun, Q., Kao, K. C., Wu, H.-J.2026-03-01💻 bioinformatics

MolX: A Geometric Foundation Model for Protein-Ligand Modelling

Il paper presenta MolX, un modello fondazionale basato su Graph Transformer che, integrando oltre 3 milioni di tasche proteiche e 5 milioni di molecole in rappresentazioni e(3)-equivarianti, supera i limiti degli approcci esistenti per modellare con precisione e interpretabilità le interazioni tridimensionali tra proteine e ligandi, ottenendo prestazioni all'avanguardia su numerosi benchmark di scoperta di farmaci.

Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.2026-03-01💻 bioinformatics

SpatialCompassV (SCOMV): De novo cell and gene spatial pattern classification and spatially differential gene identification

Il paper presenta SpatialCompassV (SCOMV), un nuovo strumento computazionale che classifica in modo non supervisionato i pattern spaziali di geni e cellule e identifica geni differenziali spazialmente analizzando le relazioni vettoriali tra le loro posizioni e regioni di interesse, come i tumori, senza dipendere da conoscenze biologiche preesistenti.

Nomura, R., Sakai, S. A., Kageyama, S.-I., Tsuchihara, K., Yamashita, R.2026-02-28💻 bioinformatics

LRSomatic: a highly scalable and robust pipeline for somatic variant calling in long-read sequencing data

LRSomatic è un pipeline Nextflow scalabile e robusto che consente un'analisi completa delle varianti somatiche (SNV, indel, varianti strutturali e CNV) e dell'epigenetica da dati di sequenziamento a lettura lunga (PacBio HiFi e ONT), colmando una lacuna critica nella genomica del cancro.

Forsyth, R. A., Harbers, L., Verhasselt, A., Iraizos, A.-L. R., Yang, S., Vande Velde, J., Davies, C., Pillay, N., Lambrechts, L., Demeulemeester, J.2026-02-28💻 bioinformatics

Nanopore sequencing reaches amplicon sequence variant (ASV) resolution

Questo studio dimostra che, grazie ai recenti miglioramenti nella precisione, il sequenziamento nanopore è ora in grado di generare direttamente varianti di sequenza ampliconica (ASV) ad alta risoluzione da letture grezze per ampliconi di 250-4200 bp, superando la dipendenza dai database di riferimento e rendendo possibile il profiling accurato di comunità microbiche complesse.

Riisgaard-Jensen, M., Villanelo, S. A. R., Andersen, K. S., Kirkegaard, R., Hansen, S. H., Jiang, C., Stefansen, A. V., Thomsen, J. H. D., Nielsen, P. H., Dueholm, M. K. D.2026-02-28💻 bioinformatics