La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Developing SCL2205 : A Protein Sequence-based Spatial Modelling Dataset for the Protein Language Model Frontier

Questo studio presenta SCL2205, un dataset di alta qualità e privo di fughe di dati derivato da UniProtKB che, grazie a un rigoroso pre-processing e a una partizione stringente, supera le prestazioni degli attuali modelli all'avanguardia nella previsione della localizzazione subcellulare delle proteine, evidenziando al contempo l'inflazione delle metriche causata da perdite di dati nei metodi esistenti.

Ouso, D., Pollastri, G.2026-03-10💻 bioinformatics

Ensemble-based genomic prediction for maize flowering-time improves prediction accuracy and reveals novel insights into trait genetic variation

Questo studio dimostra che l'uso di un approccio di previsione genomica basato su ensemble, implementato tramite la pipeline EasiGP, migliora sistematicamente l'accuratezza nella previsione dei tempi di fioritura nel mais rispetto ai singoli modelli, offrendo al contempo nuove intuizioni sulla variabilità genetica sottostante.

Tomura, S., Powell, O. M., Wilkinson, M. J., Cooper, M.2026-03-09💻 bioinformatics

Benchmarking tissue- and cell type-of-origin deconvolution in cell-free transcriptomics

Questo studio presenta un benchmarking sistematico dei metodi di deconvoluzione per l'RNA plasmatico extracellulare (cfRNA), rivelando che mentre l'inferenza dell'organo di origine è robusta, quella del tipo cellulare mostra maggiore variabilità e dipende criticamente dalla scelta del metodo e dei parametri di riferimento.

Ioannou, A., Friman, E. T., Daub, C. O., Bickmore, W. A., Biddie, S. C.2026-03-09💻 bioinformatics

Fractal: Towards FAIR bioimage analysis at scale with OME-Zarr-native workflows

Il paper introduce Fractal, un ecosistema composto da una specifica di attività e una piattaforma che abilita flussi di lavoro di analisi delle immagini biologiche scalabili, riproducibili e basati sul formato OME-Zarr per gestire grandi volumi di dati microscopici.

Lüthi, J., Cerrone, L., Comparin, T., Hess, M., Hornbachner, R., Tschan, A., Glasner de Medeiros, G. Q., Repina, N. A., Cantoni, L. K., Steffen, F. D., Bourquin, J.-P., Liberali, P., Pelkmans, L., Uh (…)2026-03-09💻 bioinformatics

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

Questo studio valuta le prestazioni di 29 algoritmi di machine learning, 80 di deep learning e 3 strumenti di polygenic risk score su 80 fenotipi binari del dataset openSNP, rivelando che i metodi di machine learning superano quelli tradizionali in 44 casi, mentre gli strumenti di polygenic risk score risultano più efficaci negli altri 36.

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics