La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

aaKomp: Alignment-free amino acid k-mer matching for genome completeness assessment at scale

Il paper presenta aaKomp, uno strumento scalabile e privo di allineamento per la valutazione rapida ed efficiente della completezza del genoma che, grazie all'uso di k-mer di aminoacidi e filtri Bloom, supera di gran lunga in velocità e risparmio di memoria gli strumenti attuali mantenendo alta accuratezza e permettendo l'uso di database di riferimento personalizzati.

Wong, J., Coombe, L., Warren, R. L., Birol, I.2026-03-22💻 bioinformatics

miRBind2 enables sequence-only prediction of miRNA binding and transcript repression

Il paper introduce miRBind2, un modello di deep learning basato esclusivamente sulla sequenza che supera le prestazioni degli strumenti esistenti nella previsione dei siti di legame e della repressione genica delle miRNA, dimostrando che le rappresentazioni apprese possono catturare segnali regolatori senza bisogno di caratteristiche biologiche ingegnerizzate.

Cechak, D., Tzimotoudis, D., Sammut, S., Gresova, K., Marsalkova, E., Farrugia, D., Alexiou, P.2026-03-21💻 bioinformatics

Novel 4D tensor decomposition-based approach integrating tri-omics profiling data can identify functionally relevant gene clusters

Questo studio presenta un nuovo approccio basato sulla decomposizione tensoriale 4D che integra dati tri-omici per identificare cluster genici funzionalmente rilevanti e meccanismi di regolazione multistrato, distinguendo tra fenomeni come l'impilamento dei ribosomi e il bufferaggio traduzionale durante la carenza di aminoacidi a catena ramificata.

Taguchi, Y.-h., Turki, T.2026-03-21💻 bioinformatics

Long-read metagenomic sequencing reveals novel lineages and functional diversity in urban soil microbiome

Questo studio ha utilizzato il sequenziamento metagenomico a letture lunghe su campioni di suolo urbano cinese per ricostruire migliaia di nuovi genomi microbici, rivelando un'ampia diversità funzionale, inclusi numerosi cluster genici biosintetici e famiglie di piccole proteine, con implicazioni significative per la salute pubblica urbana.

Duan, Y., Cusco, A., Zhang, Y., Inda-Diaz, J. S., Zhu, C., Castro, A. A., Yang, X., Yu, J., Jiang, G., Zhao, X.-M., Coelho, L. P.2026-03-21💻 bioinformatics

Coupling codon and protein constraints decouples drivers of variant pathogenicity

Questo studio dimostra che l'accoppiamento di modelli linguistici a livello di codone e proteina rivela come la patogenicità delle varianti genetiche dipenda sia dalle caratteristiche della proteina prodotta ("prodotto") che dai vincoli regolatori del processo di sintesi ("processo"), con un contributo variabile a seconda del tipo di variante e del contesto sperimentale.

Chen, R., Palpant, N., Foley, G., Boden, M.2026-03-20💻 bioinformatics

Integrative transcriptome-based drug repurposing in tuberculosis

Questo studio presenta un flusso di lavoro computazionale integrativo che, analizzando 28 firme trascrittomiche della tubercolosi, identifica 64 farmaci già approvati dalla FDA come promettenti terapie dirette all'ospite e rivela nuovi bersagli terapeutici, superando le limitazioni delle metodologie di mappatura della connettività tradizionali.

Samart, K., Thang, L., Buskirk, L. R., Tonielli, A. P., Krishnan, A., Ravi, J.2026-03-20💻 bioinformatics

SVPG: A pangenome-based structural variant detection approach and rapid augmentation of pangenome graphs with new samples

Il paper presenta SVPG, un approccio innovativo basato su grafici pangenomici che, sfruttando dati di sequenziamento a letture lunghe, garantisce una rilevazione superiore delle varianti strutturali e un'accelerazione di dieci volte nell'arricchimento dei grafici pangenomici rispetto alle strategie tradizionali.

Jiang, T., Hu, H., Gao, R., Cao, S., Jiang, Z., Liu, Y., Zhou, M., Gao, W., Zhou, S., Wang, G.2026-03-20💻 bioinformatics

PyrMol: A Knowledge-Structured Pyramid Graph Framework forGeneralizable Molecular Property Prediction

Il paper presenta PyrMol, un framework di apprendimento rappresentazionale a struttura piramidale che integra conoscenze chimiche esperte a più livelli (gruppi funzionali, farmacofori e frammenti retrosintetici) per migliorare la generalizzabilità e l'accuratezza della previsione delle proprietà molecolari rispetto agli attuali metodi basati su reti neurali grafiche.

Li, Y., Zhao, Q., Wang, J.2026-03-20💻 bioinformatics