La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Genomic-island cassette architecture drives pathogenic Enterococcus cecorum lineages: Cassette2Vec-EC, a structural genomics and machine-learning framework

Il framework Cassette2Vec-EC integra l'analisi strutturale delle isole genomiche con l'apprendimento automatico per rappresentare i genomi di *Enterococcus cecorum* come unità modulari trasferibili, consentendo una previsione ad alta accuratezza delle linee patogene e l'identificazione di specifici moduli genetici associati al rischio.

Goswami, A., Rafi, S., Lagad, R.2026-02-21💻 bioinformatics

Structural motif search across the protein-universe with Folddisco

Gli autori hanno sviluppato Folddisco, un software gratuito e un server web che, grazie a un indice compatto di caratteristiche geometriche indipendenti dalla posizione e a un sistema di punteggio basato sulla rarità, permette di cercare motivi strutturali proteici in un database di 53 milioni di strutture in pochi secondi, risultando significativamente più veloce, efficiente in termini di archiviazione e accurato rispetto ai metodi esistenti.

Kim, H., Kim, R. S., Mirdita, M., Yoon, J., Steinegger, M.2026-02-20💻 bioinformatics

ProteoMapper: Alignment-Aware Identification and Quantitative Analysis of Contextual Motif-Domain Patterns in Protein Families

Il paper presenta ProteoMapper, un framework computazionale che integra annotazione di domini e rilevamento di motivi per quantificare le relazioni spaziali e l'evoluzione conservata tra motivi regolatori e domini strutturali nelle famiglie proteiche, fornendo strumenti accessibili per l'analisi funzionale e la previsione degli effetti delle varianti.

Sefa, S. M., Sarkar, J., Robin, A. H. K., Uddin, M.2026-02-20💻 bioinformatics

Geometric-aware and interpretable deep learning for single-cell batch correction via explicit disentanglement and optimal transport

Il paper presenta iDLC, un framework di deep learning interpretabile che risolve i problemi di correzione dei batch nel sequenziamento dell'RNA a singola cellula attraverso la disentanglement esplicito delle caratteristiche e l'allineamento basato sul trasporto ottimo, garantendo una rimozione robusta degli effetti tecnici mentre preserva l'integrità biologica e la scalabilità su dataset di grandi dimensioni.

Jiang, C., Zheng, R., Ji, Y., Cao, S., Fang, Y., Wang, Z., Wang, R., Liang, S., Tao, S.2026-02-20💻 bioinformatics

A New Sparse Bayesian Quantile Neural Network-based Approach and Its Application to Discover Physiological Sweet Spots in the Canadian Longitudinal Study on Aging

Questo studio presenta Q-FSNet e Q-DirichNet, nuovi approcci basati su reti neurali sparse bayesiane che, applicati allo studio longitudinale canadese sull'invecchiamento, identificano con successo 25 metaboliti con "punti dolci" fisiologici ottimali per minimizzare l'accelerazione dell'età biologica, offrendo uno strumento scalabile e interpretabile per la medicina di precisione.

Min, J., Vishnyakova, O., Brooks-Wilson, A., Elliott, L. T.2026-02-20💻 bioinformatics