La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Benchmarking long-read simulators against Oxford Nanopore whole-genome sequencing data

Questo studio confronta sei simulatori di letture Oxford Nanopore con dati R10.4.1, rilevando che, sebbene PBSIM3 eccella nel replicare le proprietà generali a livello di lettura, nessuno strumento cattura completamente i complessi profili di errore dei dati reali, suggerendo che la scelta ottimale dipenda dal fatto che, per una data applicazione, siano più critici il realismo a livello di lettura o le specifiche strutture di errore.

Taouk, M. L., Ingle, D. J., Wick, R. R.2026-05-11💻 bioinformatics

Nanopore event detection in a simple and adaptive way

Questo articolo presenta e valida un semplice, rapido e adattabile algoritmo di rilevamento degli eventi basato su cluster (CBED) che supera gli schemi esistenti in termini di efficienza e riduzione del rumore per i dati dei nanopori biologici, evidenziando al contempo la necessità di una correzione adattiva della linea di base per i dati dei nanopori in stato solido.

Wei, P., Kansari, M., Mierzejewski, M., Ensslen, T., Lin, C.-Y., Kavetsky, K., Jones, P. D., Behrends, J. C., Drndic, M., Fyta, M.2026-05-11💻 bioinformatics

Investigation of Protein Melting Temperature Prediction with Cross-Method Validation on Biophysical Data

Questo studio introduce TmProt 1.0, un modello di embedding ESM-2 fine-tuned che supera i predittori all'avanguardia esistenti nell'identificazione di proteine termostabili attraverso dataset biofisici eterogenei, affrontando la sfida critica della generalizzazione cross-dominio nella previsione della temperatura di fusione delle proteine.

Pailozian, K., Kohout, P., Damborsky, J., Mazurenko, S.2026-05-11💻 bioinformatics

The Second Brain: Diffusion Models for Realistic Human Microbiome Generation

Questo lavoro introduce un modello generativo basato sulla diffusione con meccanismi di preservazione della sparsità che ottiene una preservazione della sparsità a livello parametrico e metriche di distanza ecologica competitive per i dati del microbioma umano, rappresentando il primo approccio di deep learning in grado di corrispondere a tale fedeltà nella sparsità pur rimanendo competitivo sui benchmark ecologici standard.

Yee, B., Fu, J.2026-05-11💻 bioinformatics

Haplotype-resolved diploid genome inference on pangenome graphs

Il documento presenta DipGenie, uno strumento scalabile che ottimizza congiuntamente il genotipizzamento e la fase su grafi pangenomici utilizzando un budget di ricombinazione motivato biologicamente, ottenendo tassi di errore di commutazione significativamente più bassi e punteggi F1 per le varianti strutturali più elevati rispetto ai metodi basati su grafi esistenti.

Chandra, G., Doan, W. T., Gibney, D.2026-05-10💻 bioinformatics

Machine learning cross-platform proteomic imputation enables protein quality scoring and replication of epidemiological associations

Questo studio sviluppa un framework di apprendimento automatico per imputare dati proteomici tra piattaforme SomaScan e Olink, risolvendo così problemi persistenti di non-ripetibilità, consentendo il recupero di segnali esclusivi della piattaforma e stabilendo un indice di fedeltà proteica per migliorare l'affidabilità della scoperta di biomarcatori epidemiologici.

Li, L., Alaa, A., Tan, Y., Demirel, I., Friedman, S., Zha, Q., Trac, R. P., Taylor, K. D., Yu, B., Ballantyne, C. M., Deo, R., Dubin, R., Tsai, M. Y., Peloso, G. M., Brody, J., Austin, T., Psaty, B. M (…)2026-05-09💻 bioinformatics

Cross Dataset Transcriptomic Analysis Identifies Oxidative Stress Inflammation Gene Networks Modulated by Nutrigenomic Interventions in Parkinson Disease

Questo studio utilizza un'analisi trascrittomica integrativa cross-dataset per identificare i geni hub correlati allo stress ossidativo e all'infiammazione nel morbo di Parkinson e rivela come specifici composti bioattivi degli alimenti possano modulare queste reti geniche attraverso interventi nutrigenomici.

Rafiee, M., Abaj, F., Mahdevar, M., Rashidian, A., Ghaedi, K., Ghiasvand, R.2026-05-09💻 bioinformatics