La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

Questo studio valuta le prestazioni di 29 algoritmi di machine learning, 80 di deep learning e 3 strumenti di polygenic risk score su 80 fenotipi binari del dataset openSNP, rivelando che i metodi di machine learning superano quelli tradizionali in 44 casi, mentre gli strumenti di polygenic risk score risultano più efficaci negli altri 36.

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics

MapMyCells: High-performance mapping of unlabeled cell-by-gene data to reference brain taxonomies

Il paper presenta MapMyCells, un framework open-source ad alte prestazioni che permette di mappare in modo efficiente, deterministico e modale-agnostico dataset omici cellulari non etichettati su tassonomie di riferimento gerarchiche per il cervello, facilitando l'integrazione cross-studio e l'annotazione riproducibile senza richiedere hardware specializzato.

Daniel, S. F., Lee, C., Mollenkopf, T., Lee, M., Arbuckle, J., Fiabane, E., Gabitto, M. I., Johansen, N., Kapen, I., Kraft, A. W., Lai, J., Li, S. Y., McGinty, R., Miller, J. A., Welch-Moosman, S., Ot (…)2026-03-09💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

Questo studio presenta un dataset migliorato e standardizzato per la previsione dell'infezione virale nei mammiferi, dimostrando che le prestazioni dei modelli di machine learning migliorano significativamente quando si prevedono categorie ospiti più ampie e si riduce la distanza filogenetica tra i dati di addestramento e di test, mentre la generalizzazione a virus completamente nuovi rimane una sfida aperta.

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

Il documento presenta il SSIT (Stochastic System Identification Toolkit), un software open-source in MATLAB progettato per modellare, adattare, prevedere e ottimizzare la progettazione di esperimenti su dati biologici rumorosi e stocastici, offrendo strumenti avanzati per l'inferenza dei parametri, l'analisi di sensibilità e la gestione delle distorsioni sperimentali attraverso un'interfaccia grafica e pipeline automatizzabili.

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

MS-BCR-DB: an integrated BCR repertoire database to mine humoral multiple sclerosis signatures

Il paper presenta MS-BCR-DB, il primo database pubblico e uniformemente elaborato di repertori BCR umani nella sclerosi multipla, che integra dati clinici e sequenze per identificare firme immunitarie condivise, come l'uso di geni V specifici e cloni convergenti reattivi sia contro l'Epstein-Barr virus che contro proteine autoanticorpali del sistema nervoso centrale.

Ballerini, C., Cardente, N., Abbate, M. F., Le Quy, K., Rincon, N., Wolfram, L., Lossius, A., Portaccio, E., Amato, M. P., Ballerini, C., Greiff, V.2026-03-08💻 bioinformatics