La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

CancerSTFormer enables multi-scale analysis of spot-resolution spatial transcriptomes and dissects the gene and immune regulatory responses of targeted therapies

Il paper presenta CancerSTFormer, un modello fondazionale spaziale multi-scala che analizza i dataset di trascrittomica spaziale a risoluzione di spot per decifrare le risposte geniche e immunitarie alle terapie mirate, identificando geni differenziali specifici delle nicchie e migliorando la comprensione della resistenza e sensibilità ai trattamenti oncologici.

Strope, B., Varghese, D., Bowie, W., Wang, S., Zhu, Q.2026-03-03💻 bioinformatics

The One Click Wonder: a retrained automated segmentation pipeline that enables quantitative and modular analysis of C. elegans embryos

Gli autori presentano "One Click Wonder" (OCW), una pipeline automatizzata e modulare che combina un modello Cellpose riaddestrato con il mappatore BAAM per ottenere una segmentazione ad alta produttività e un'analisi quantitativa a livello di singola cellula dell'espressione genica negli embrioni di C. elegans.

Bassett, P. C., Verheijen, T. E., Angonezi, A. L., Andriollo, A., Herbert, S., Roth, G., Chao, J., Mango, S. E.2026-03-03💻 bioinformatics

STCS: A Platform-Agnostic Framework for Cell-Level Reconstruction in Sequencing-Based Spatial Transcriptomics

Il paper presenta STCS, un framework open-source e indipendente dalla piattaforma che ricostruisce profili di espressione genica a livello cellulare integrando la segmentazione dei nuclei con un modello di distanza spaziale e trascrittomica, superando così le limitazioni delle attuali tecnologie di trascrittomica spaziale basate su sequenziamento.

Chen Wu, L., Hu, X., Zhan, F., Sun, C., Gonzales, J., Ofer, R., Tran, T., Verzi, M. P., Liu, L., Yang, J.2026-03-03💻 bioinformatics

snputils: A High-Performance Python Library for Genetic Variation and Population Structure

Il paper presenta snputils, una libreria Python open-source ad alte prestazioni che unifica l'input/output, la trasformazione e l'analisi dei dati genetici in un unico framework scalabile e riproducibile, risolvendo le limitazioni di compatibilità ed efficienza degli strumenti esistenti per la ricerca su larga scala in genetica delle popolazioni.

Bonet, D., Comajoan Cara, M., Barrabes, M., Smeriglio, R., Agrawal, D., Aounallah, K., Geleta, M., Dominguez Mantes, A., Thomassin, C., Shanks, C., Huang, E. C., Franquesa Mones, M., Luis, A., Saurina (…)2026-03-03💻 bioinformatics

A comprehensive assessment of tandem repeat genotyping methods for Nanopore long-read genomes

Questo studio presenta una valutazione sistematica di sette strumenti bioinformatici per il genotipaggio delle ripetizioni in tandem su dati di sequenziamento Nanopore, dimostrando che la sola accuratezza nella lunghezza è insufficiente e che la valutazione a livello di sequenza è essenziale per selezionare gli strumenti più adatti a studi di popolazione e diagnosi cliniche.

Aliyev, E., Avvaru, A., De Coster, W., Arner, G. M., Nyaga, D. M., Gibson, S. B., Weisburd, B., Gu, B., Gonzaga-Jauregui, C., 1000 Genomes Long-Read Sequencing Consortium,, Chaisson, M. J. P., Miller (…)2026-03-03💻 bioinformatics

Large-Scale Statistical Dissection of Sequence-Derived Biochemical Features Distinguishing Soluble and Insoluble Proteins

Questo studio analizza su larga scala 78.031 proteine per dimostrare che le caratteristiche biochimiche derivate dalla sequenza che distinguono le proteine solubili da quelle insolubili sono intrinsecamente a bassa dimensionalità e governate da effetti deboli e coordinati, con lunghezza della sequenza e carica negativa come predittori più significativi.

Vu, N. H. H., Nguyen Bao, L.2026-03-03💻 bioinformatics

The limits of Bayesian estimates of divergence times in measurably evolving populations

Attraverso simulazioni e analisi empiriche, questo studio stabilisce che, nei dati eterocroni come quelli virali, l'incertezza nelle stime dei tempi di divergenza è determinata dalla distanza dai punti di calibrazione noti e dalla dimensione del dataset, piuttosto che dall'età assoluta dei nodi, definendo così i limiti teorici minimi di precisione raggiungibili.

Ivanov, S., Fosse, S., dos reis, M., Duchene, S.2026-03-03💻 bioinformatics

Phenotypic Bioactivity Prediction as Open-set Biological Assay Querying

Il paper presenta OpenPheno, un modello fondazionale multimodale che rivoluziona la scoperta di farmaci trasformando la previsione dell'attività biologica in un compito di domanda e risposta visivo-linguistico a set aperto, consentendo di prevedere l'efficacia di nuovi composti su assay mai visti in precedenza partendo da un'unica immagine fenotipica universale senza necessità di dati sperimentali specifici.

Sun, Y., Zhang, X., Zheng, Q., Li, H., Zhang, J., Hong, L., Wang, Y., Zhang, Y., Xie, W.2026-03-03💻 bioinformatics