La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

DeepTrio: Variant Calling in Families Using Deep Learning

DeepTrio è un modello di deep learning che migliora l'accuratezza della chiamata delle varianti genetiche nelle famiglie analizzando direttamente i dati di sequenziamento dei trii (madre, padre e figlio), superando le prestazioni di DeepVariant sia su dati Illumina che PacBio HiFi senza richiedere codifiche esplicite di prior di ereditarietà.

Brambrink, L., Kolesnikov, A., Goel, S., Nattestad, M., Yun, T., Baid, G., Yang, H., McLean, C., Shafin, K., Chang, P.-C., Carroll, A.2026-04-02💻 bioinformatics

Optimisation of Weighted Ensembles of Genomic Prediction Models in Maize

Questo studio dimostra che l'ottimizzazione dei pesi negli ensemble di modelli di previsione genomica per il mais, utilizzando approcci come la trasformazione lineare, Nelder-Mead e Bayesiano, può migliorare le prestazioni predittive rispetto alla media semplice, specialmente quando i pesi ottimali differiscono significativamente da quelli uguali, sebbene nessun singolo metodo di ottimizzazione si sia rivelato nettamente superiore agli altri.

Tomura, S., Powell, O. M., Wilkinson, M. J., Lefevre, J., Cooper, M.2026-04-02💻 bioinformatics

EMITS: expectation-maximization abundance estimation for fungal ITS communities from long-read sequencing

Il documento presenta EMITS, uno strumento basato su Rust che utilizza l'algoritmo expectation-maximization per migliorare l'accuratezza della stima dell'abbondanza delle specie fungine nei dati di sequenziamento ITS a lettura lunga, risolvendo le ambiguità di classificazione tipiche dei metodi tradizionali.

O'Brien, A., Lagos, C., Fernandez, K., Ojeda, B., Parada, P.2026-04-02💻 bioinformatics

TF-IDF k-mer-based Classical and Hybrid Machine Learning Models for SARS-CoV-2 Variant Classification under Imbalanced Genomic Data

Questo studio dimostra che un approccio ibrido RF-SVM basato su caratteri k-mer TF-IDF supera i metodi di deep learning nella classificazione delle varianti di SARS-CoV-2, offrendo una soluzione efficace e interpretabile per il rilevamento di varianti rare in contesti di dati genomici fortemente sbilanciati.

Haque, N., Mazed, A., Ankhi, J. N., Uddin, M. J.2026-04-02💻 bioinformatics

Inferring a novel insecticide resistance metric and exposurevariability in mosquito bioassays across Africa

Gli autori sviluppano un nuovo modello matematico che integra i dati dei saggi di suscettibilità a dosi intensive per quantificare l'eterogeneità della resistenza agli insetticidi nelle popolazioni di zanzare e prevedere con maggiore precisione l'efficacia delle zanzariere trattate, superando i limiti dei tradizionali saggi a dose discriminante.

Denz, A., Kont, M. D., Sanou, A., Churcher, T. S., Lambert, B.2026-04-01💻 bioinformatics