La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

DeepTrio: Variant Calling in Families Using Deep Learning

DeepTrio è un modello di deep learning che migliora l'accuratezza della chiamata delle varianti genetiche nelle famiglie analizzando direttamente i dati di sequenziamento dei trii (madre, padre e figlio), superando le prestazioni di DeepVariant sia su dati Illumina che PacBio HiFi senza richiedere codifiche esplicite di prior di ereditarietà.

Brambrink, L., Kolesnikov, A., Goel, S., Nattestad, M., Yun, T., Baid, G., Yang, H., McLean, C., Shafin, K., Chang, P.-C., Carroll, A.2026-04-02💻 bioinformatics

Optimisation of Weighted Ensembles of Genomic Prediction Models in Maize

Questo studio dimostra che l'ottimizzazione dei pesi negli ensemble di modelli di previsione genomica per il mais, utilizzando approcci come la trasformazione lineare, Nelder-Mead e Bayesiano, può migliorare le prestazioni predittive rispetto alla media semplice, specialmente quando i pesi ottimali differiscono significativamente da quelli uguali, sebbene nessun singolo metodo di ottimizzazione si sia rivelato nettamente superiore agli altri.

Tomura, S., Powell, O. M., Wilkinson, M. J., Lefevre, J., Cooper, M.2026-04-02💻 bioinformatics

Benchmarking Agentic Bioinformatics Systems for Complex Protein-Set Retrieval: A Coccolithophore Calcification Case Study

Questo studio valuta le prestazioni di tre sistemi di agenti basati su LLM nel recupero di proteine legate alla calcificazione dei coccolitofori, dimostrando che l'agente Codex offre il miglior equilibrio tra sensibilità, specificità e stabilità rispetto a Biomni e DeerFlow, evidenziando come la qualità dell'agente dipenda più dalla precisione nella decomposizione delle richieste e nella generazione di query che dal volume grezzo dei risultati.

Zhang, X.2026-04-02💻 bioinformatics

Resolution of recursive data corruption to transform T-cell epitope discovery

Il documento evidenzia come la contaminazione ricorsiva dei dati immunopeptidomici da parte di modelli predittivi abbia compromesso lo sviluppo di terapie T-cellulari, proponendo e validando sperimentalmente un nuovo approccio, deepMHCflare, che supera questo bias utilizzando esclusivamente dati puliti per identificare epitoti immunogenici con maggiore precisione.

Preibisch, G., Tyrolski, M., Kucharski, P., Gizinski, S., Grzegorczyk, P., Moon, S., Kim, S., Zaro, B., Gambin, A.2026-04-02💻 bioinformatics