La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

DualLoc: Full-parameter fine-tuning of cascaded dual transformers for protein subcellular localization prediction

Il paper introduce DualLoc, un modello basato su un'architettura a doppio trasformatore con fine-tuning completo che supera gli stati dell'arte nella previsione multi-compartmentale della localizzazione subcellulare delle proteine, offrendo sia strumenti predittivi più accurati che nuove intuizioni biologiche sulle interazioni tra organelli.

Chen, Y. G., Chung, W.-Y., Chang, K. Y.2026-03-30💻 bioinformatics

Clinical evidence yield as a framework for evaluating computational predictors and multiplexed assays of variant effect

Questo studio introduce la "forza media delle prove" (MES), una nuova metrica quantitativa basata su calibrazione bayesiana che valuta l'utilità clinica di predittori computazionali e saggi multiplex per le varianti di significato incerto, superando i limiti delle tradizionali metriche di discriminazione come l'AUROC.

Shang, Y., Badonyi, M., Marsh, J. A.2026-03-30💻 bioinformatics

FoldaVirus, a knowledge-based icosahedral capsid builder using AlphaFold

Il paper presenta FoldaVirus, un metodo e strumento web che combina le previsioni di AlphaFold con le conoscenze sulle architetture icosaedriche note per generare modelli di capsidi virali tridimensionali validati energeticamente, colmando così il divario tra le vaste sequenze di proteine disponibili e la loro struttura 3D.

Rojas Labra, O., Montoya-Munoz, D. S., Santoyo-Rivera, N., McDonald, J., Montiel-Garcia, D., Case, D. A., Reddy, V. S.2026-03-30💻 bioinformatics

ALPINE: A Scalable Pipeline for Comprehensive Classification of Gene-Editing Outcomes from Long-Read Amplicon Sequencing

Il documento presenta ALPINE, una pipeline scalabile e riproducibile basata su sequenziamento ampliconico a lettura lunga che classifica e quantifica in modo completo gli esiti eterogenei dell'editing genico, inclusi i sottotipi di integrazione dei vettori, superando le limitazioni degli strumenti esistenti.

Chen, Y., Gao, X.-H., Vichas, A., Wang, J., Golhar, R., Neuhaus, I.2026-03-30💻 bioinformatics

Deciphering sepsis molecular subtypes using large-scale data to identify subtype-specific drug repurposing

Questo studio crea un atlante trascrittomico su larga scala per identificare quattro sottotipi molecolari di sepsi (C1-C4) e propone strategie di riproposizione di farmaci specifici per ciascun sottotipo, spiegando così i fallimenti precedenti dei trial clinici e aprendo la strada a una medicina di precisione.

Smith, L. A., Augustin, B., Jacob, V., Black, L. P., Bertrand, A., Hopson, C., Cagmat, E., Datta, S., Reddy, S., Guirgis, F., Graim, K.2026-03-30💻 bioinformatics

methbiome: reference-based DNA methylation profiling of long-read metagenomic data

Il paper presenta methbiome, una nuova pipeline basata su Snakemake e disponibile su GitHub che consente il profilo di metilazione del DNA in dati metagenomici a lettura lunga (Oxford Nanopore e PacBio) in un contesto di riferimento, facilitando il confronto tra campioni e l'analisi di motivi di metilazione sia in comunità microbiche che in isolati.

Costeira, R., Eustratiou Wong, E., Bell, J. T.2026-03-30💻 bioinformatics

The End of Aging Clocks: Training Foundation Models to Reason in Aging and Longevity

Il documento presenta Longevity-LLM v0.1, un modello linguistico fondazionale multimodale che supera i tradizionali orologi biologici specializzati, offrendo previsioni di età e analisi di sopravvivenza con maggiore accuratezza e interpretabilità biologica.

Zhavoronkov, A., Aladinskyi, V., Aliper, A., Miftakhutdinov, Z., Reymond, M., Naumov, V., Zagirova, D., Pushkov, S., Sidorenko, D., Shayakhmetov, R., Galkin, F.2026-03-30💻 bioinformatics

SpacerScope: Binary-vectorized, genome-wide off-target profiling for RNA-guided nucleases without prior candidate-site bias

Il paper presenta SpacerScope, un nuovo framework ad alta velocità e sensibilità per il profilo degli effetti off-target a livello genomico delle nucleasi guidate da RNA, che utilizza la vettorizzazione binaria e operazioni bitwise per identificare in modo completo e senza pregiudizi sostituzioni, inserzioni e delezioni, superando i limiti computazionali e di sensibilità degli strumenti esistenti.

Qu, Y., Wang, Y., Yan, W., Tang, H., Chen, Q.2026-03-30💻 bioinformatics