La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Structure-aware geometric graph learning for modeling protease-substrate specificity at scale

Il paper introduce OmniCleave, un framework di apprendimento geometrico basato su grafi che supera i limiti degli approcci tradizionali basati su sequenze per modellare con precisione e scalabilità la specificità proteasi-substrato, integrando informazioni strutturali e relazionali per identificare nuovi siti di clivaggio biologici.

Guo, X., Bi, Y., Ran, Z., Pan, T., Sun, H., Hao, Y., Jia, R., Wang, C., Zhang, Q., Kurgan, L., Song, J., Li, F.2026-04-10💻 bioinformatics

A computational model for quantifying instability of tandem repeats across the genome

Gli autori presentano un modello computazionale generale basato su dati di sequenziamento a letture lunghe che quantifica l'instabilità genomica delle ripetizioni in tandem, distinguendo le variazioni biologiche dal rumore tecnico e rivelando come la composizione della ripetizione, piuttosto che la sua lunghezza, guidi tale instabilità.

Dolzhenko, E., English, A., Mokveld, T., de Sena Brandine, G., Kronenberg, Z., Wright, G., Drogemoller, B., Rowell, W. J., Wenger, A. M., Bennett, M. F., Weisburd, B., Erwin, G. S., Jin, P., Nelson, D (…)2026-04-10💻 bioinformatics

BrightEyes-FFS: an open-source platform for comprehensive analysis of fluorescence fluctuation spectroscopy experiments with small detector arrays

Il paper presenta BrightEyes-FFS, una piattaforma open-source basata su Python che offre un ambiente completo e user-friendly per l'analisi di dati di spettroscopia di fluttuazione della fluorescenza ottenuti con piccoli array di rivelatori, colmando la mancanza attuale di software di questo tipo.

Slenders, E., Perego, E., Zappone, S., Vicidomini, G.2026-04-10💻 bioinformatics

Statistical Principles Define an Open-Source Differential Analysis Workflow for Mass Spectrometry Imaging Experiments with Complex Designs

Questo articolo presenta un flusso di lavoro open-source basato su principi statistici per l'analisi differenziale di esperimenti di imaging spettrometrico di massa con disegni complessi, illustrando l'impatto critico delle scelte riguardanti l'elaborazione del segnale, l'aggregazione delle caratteristiche, la selezione delle regioni di interesse e i modelli statistici attraverso uno studio di caso su campioni umani e dataset simulati.

Rogers, E. B. T., Lakkimsetty, S. S., Bemis, K. A., Schurman, C. A., Angel, P. A., Schilling, B., Vitek, O.2026-04-10💻 bioinformatics

TopicVI: A Knowledge-guided deep interpretable model for resolving context-specific gene programs

Il paper presenta TopicVI, un modello interpretabile guidato dalla conoscenza che integra dati biologici preesistenti con l'apprendimento automatico per scoprire programmi genici specifici del contesto in dati di trascrittomica a singola cellula e spaziale, superando i limiti dei metodi tradizionali e rivelando nuovi meccanismi terapeutici in malattie complesse come il glioblastoma.

Cai, G., Zhao, W., Zhu, X., Lin, Y., Zhou, B., Cao, J., He, Q., Yang, B., Gu, X., Xiong, X., Zhou, Z.2026-04-10💻 bioinformatics

DIANA: Deep Learning Identification and Assessment of Ancient DNA

Il paper introduce DIANA, una rete neurale multi-task addestrata su abbondanze di unitig che, superando i limiti dei metodi basati su database di riferimento, identifica con alta accuratezza e generalizzazione semantica metadati chiave (ospite, tipo di comunità e materiale) in campioni di DNA antico, accelerando così la ricerca in metagenomica antica.

Duitama Gonzalez, C., Lopopolo, M., Nishimura, L., Faure, R., Duchene, S.2026-04-10💻 bioinformatics

Divergent landscapes of positive and negative selection signatures across residue-resolved human-virus protein-protein interaction interfaces

Questo studio integra mappe di interazioni proteina-proteina uomo-virus con contatti residuo-residuo per rivelare come le pressioni selettive positive e negative si organizzino spazialmente in modo eterogeneo sulle interfacce delle proteine ospiti, evidenziando che le interfacce bersaglio di mimetismo virale fungono da punti focali per l'evoluzione adattativa.

Su, W.-C., Xia, Y.2026-04-10💻 bioinformatics

Dissecting the Black Box of AlphaFold in Protein-Protein Complex Assembly

Questo studio smonta il "black box" di AlphaFold rivelando che l'assemblaggio dei complessi proteici è guidato principalmente dalla geometria strutturale dei monomeri e dal complemento interfacciale piuttosto che dalla coevoluzione inter-proteica, identificando la plasticità strutturale come il principale ostacolo alla previsione accurata dei complessi antigene-anticorpo.

Li, S., Mu, Z., Yan, C.2026-04-09💻 bioinformatics