La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

BiOS: An Open-Source Framework for the Integration of Heterogeneous Biodiversity Data

Il documento presenta BiOS, un framework open-source modulare che, aderendo ai principi FAIR, risolve le problematiche di eterogeneità e frammentazione dei dati sulla biodiversità offrendo sia un'API per sviluppatori che un'interfaccia web intuitiva per l'esplorazione e l'integrazione di risorse multidisciplinari.

Roldan, A., Duran, T. G., Far, A. J., Capa, M., Arboleda, E., Cancellario, T.2026-03-16💻 bioinformatics

SC-BIG: A Hierarchical Bayesian Model for Bulk-Informed Single Nucleotide Variant Calling in Single Cells

Il paper presenta SC-BIG, un modello bayesiano gerarchico che sfrutta i dati di sequenziamento bulk per migliorare l'identificazione delle varianti nucleotidiche somatiche nelle cellule singole, superando i limiti dei metodi esistenti e fornendo probabilità posteriori ben calibrate per l'analisi dell'eterogeneità tumorale.

Schuette, D., Kono, T. J. Y., Schwarz, R. F.2026-03-16💻 bioinformatics

An explanatory benchmark of spatial domain detection reveals key drivers of method performance

Questo studio presenta un benchmark esplicativo di 26 metodi per il rilevamento di domini spaziali su 63 sezioni tissutali e oltre 1.000 dataset semi-sintetici, rivelando che le prestazioni dipendono fortemente dalla risoluzione e dall'eterogeneità cellulare e dimostrando che la scelta della pre-elaborazione e del clustering ha un impatto maggiore rispetto alla novità architetturale nelle reti neurali.

Descoeudres, A., Prusina, T., Schmidt, N., Do, V. H., Mages, S., Klughammer, J., Matijevic, D., Canzar, S.2026-03-16💻 bioinformatics

Detecting Manuscripts Related to Computable Phenotypes Using a Transformer-based Language Model

Gli autori hanno sviluppato e implementato con successo un modello basato su BioBERT, integrato nella piattaforma CIPHER, per identificare in modo automatico e scalabile definizioni di fenotipi computabili nella letteratura biomedica, consentendo inoltre il feedback degli utenti per il continuo affinamento del sistema.

Chae, J., Heise, D. A., Connatser, K., Honerlaw, J., Maripuri, M., Ho, Y.-L., Fontin, F., Tanukonda, V., Cho, K.2026-03-16💻 bioinformatics

Deciphering the Genetic Architecture of Sorghum Grain Oil Content via Lipidome-Integrated Genome-Wide Association Analysis

Questo studio integra lipidomica su larga scala e studi di associazione genome-wide in 266 accessi di sorgo per decifrare l'architettura genetica del contenuto di olio nei chicchi, identificando nuovi loci chiave e marcatori per migliorare la qualità nutrizionale di questa coltura resistente alla siccità.

Jiao, Y., Nigam, D., Metwally, S., Chen, F.2026-03-16💻 bioinformatics

High-Fidelity Long-term Whole-embryo Lineage and Fate Reconstruction by Iterative Tracking with Error Correction

Il paper presenta ITEC, un metodo completamente non supervisionato che ricostruisce con alta fedeltà le linee cellulari e le mappe di destino di interi embrioni attraverso il tracciamento iterativo con correzione degli errori, validato su diversi organismi modello e applicato con successo a dataset su larga scala per rivelare dinamiche morfogenetiche e correlazioni con la trascrittomica spaziale.

Wang, M., Zhang, Q., Wang, C., Chi, Y., Zheng, W., Mu, Z., Cao, X., Zhang, W., Yang, B., Schier, A. F., Acedo, J. N., Wan, Y., Yu, G.2026-03-16💻 bioinformatics

Integrative modeling of read depth and B-allele frequency improves single-cell copy number calling from targeted DNA sequencing panels

Il documento presenta scPloidyR, un modello statistico che integra profondità di lettura e frequenza degli alleli B per migliorare l'identificazione delle variazioni del numero di copie del DNA a livello di singola cellula nei dati di sequenziamento Tapestri, dimostrando prestazioni superiori rispetto ai metodi basati solo sulla profondità quando sono disponibili informazioni alleliche.

Pei, D., Griffard-Smith, R., Cano Urrego, B., Schueddig, E.2026-03-16💻 bioinformatics

SpotGraphs: Graph-based analysis of spatially resolved transcriptional data in R

Il pacchetto SpotGraphs per R offre un approccio flessibile e diretto all'analisi dei dati di trascrittomica spaziale sfruttando l'infrastruttura igraph, consentendo agli utenti di modificare e interrogare le relazioni di adiacenza tra i punti spaziali e fornendo strumenti per il filtraggio dei dati e l'identificazione di confini di interesse, con prestazioni paragonabili alla controparte Python SquidPy.

Lee, A. J., Sanin, D. E.2026-03-16💻 bioinformatics

Chemically informed representations of amino acids enable learning beyond the canonical protein alphabet

Gli autori propongono una rappresentazione chimicamente informata degli amminoacidi basata sulle loro strutture bidimensionali, che permette ai modelli di apprendere direttamente le proprietà fisico-chimiche e di generalizzare a modificazioni post-traduzionali non viste durante l'addestramento, superando i limiti dell'alfabeto standard a venti lettere.

Christiansen, J. C., Gonzalez-Valdes Tejero, M., Hembo, C. S., Li, Y., Barra, C.2026-03-16💻 bioinformatics

UniST: A Unified Computational Framework for 3D Spatial Transcriptomics Reconstruction

Il paper presenta UniST, un quadro computazionale unificato basato sull'intelligenza artificiale che ricostruisce paesaggi di trascrittomica spaziale 3D densi e continui partendo da sezioni seriali sparse e frammentate, ripristinando l'architettura tissutale e i pattern di espressione genica significativi senza modificare le tecnologie sperimentali esistenti.

Shui, L., Liu, Y., Julio, I. C. L., Clemenceau, J. R., Hoi, X. P., Dai, Y., Lu, W., Min, J., Khan, K., Roemer, B., Jiang, M., Waters, R. E., Colbert, K., Maitra, A., Wintermark, M., Yuan, Y., Chan, K. (…)2026-03-16💻 bioinformatics