La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

From variability to consensus: rescoring harmonizes peptide identification across diverse search engines and datasets

Lo studio dimostra che le strategie avanzate di rescoring armonizzano l'identificazione dei peptidi tra diversi motori di ricerca e dataset, migliorando la robustezza e la comparabilità delle analisi proteomiche, sebbene richiedano un'attenta selezione delle caratteristiche e della scelta del database per garantire un controllo affidabile del FDR.

Winkelhardt, D., Berres, S., Uszkoreit, J.2026-03-06💻 bioinformatics

Diffusion-ACP39: A Decoder-Adaptive Latent Diffusion Framework for Generative Anticancer Peptide Discovery

Il paper presenta Diffusion-ACP39, un modello generativo basato sulla diffusione latente che, integrato con un autoencoder sincronizzato e validato da un classificatore Random Forest (RF-ACP39), riesce a progettare con un'accuratezza del 94,5% nuovi peptidi anticancro di lunghezza variabile tra 5 e 39 amminoacidi, offrendo un'alternativa efficiente ai metodi tradizionali di laboratorio.

Yan, J., Wu, Q., Li, Y., Cai, J., Zhou, M., CACPbell-Valois, F.-X., Siu, S. W.2026-03-06💻 bioinformatics

ESGI: Efficient splitting of generic indices in single-cellsequencing data

Il paper presenta ESGI, un framework flessibile ed efficiente per la demultiplexazione e l'elaborazione di dati di sequenziamento a cellula singola che gestisce architetture di barcode arbitrarie, inclusi errori di inserimento e cancellazione, offrendo una soluzione generalizzabile per esperimenti complessi e multimodali.

Stohn, T., van de Brug, N. D., Theodosiadou, A., Thijssen, B., Jastrzebski, K., Wessels, L. F. A., Bosdriesz, E.2026-03-06💻 bioinformatics

Phenotypic reversion and target prioritization for cellular inflammation via representation learning with foundation models

Questo studio presenta un framework basato su modelli foundation a singola cellula e dati Perturb-seq su larga scala che, integrando condizioni infiammatorie rilevanti per la malattia, identifica in modo efficace nuovi bersagli terapeutici per il ripristino fenotipico dell'infiammazione cellulare.

Wong, D. R., Piper, M., Qiao, J., Russo, M., Jean, P., Clevert, D.-A., Arroyo, J., Pashos, E.2026-03-06💻 bioinformatics

Comprehensive Transcriptomic Analysis of Atopic Dermatitis Patients Documents the Spectrum of Molecular Abnormalities and the Response to Treatment

Questo studio integra dati trascrittomici multipli per delineare le firme immunitarie e di barriera distinte dell'atopia dermatite in base all'età e al tipo di malattia, sviluppando il punteggio ECZECIS come biomarcatore quantitativo che dimostra la superiorità del dupilumab nel ridurre l'attivazione immunitaria sistemica e cutanea.

Daamen, A., Shrotri, S., Grammer, A., Lipsky, P. E.2026-03-06💻 bioinformatics

TFBSpedia: a comprehensive human and mouse transcription factor binding sites database

Questo studio presenta TFBSpedia, un database completo e un motore di ricerca efficiente che integra e valuta criticamente milioni di siti di legame per fattori di trascrizione umani e murini provenienti da diverse fonti, fornendo punteggi di affidabilità e rilevanza biologica per migliorare la comprensione della regolazione genica.

Li, S., Chou, E., Wang, K., Boyle, A. P., Sartor, M. A.2026-03-06💻 bioinformatics

GWAS Summary Statistic Tool: A Meta-Analysis and Parsing Tool for Polygenic Risk Score Calculation

GWASPoker è uno strumento in Python che ottimizza la selezione e l'analisi preliminare delle statistiche riassuntive degli studi di associazione genome-wide (GWAS) dal Catalogo GWAS, consentendo di identificare automaticamente i file adatti per il calcolo dei punteggi di rischio poligenico (PRS) tramite download parziale e rilevamento degli intestazioni senza richiedere il trasferimento completo dei dati.

Muneeb, M. -, Ascher, D.2026-03-06💻 bioinformatics

Circular RNA identification using a genomic language model and a small number of authenticated examples

Il paper presenta circFormer, un approccio innovativo basato su un modello linguistico genomico e sull'apprendimento curricolare che supera la scarsità di dati di addestramento per identificare con alta precisione e interpretabilità le RNA circolari, confermando sperimentalmente la validità della maggior parte delle previsioni.

Li, K., Wang, W., Jiang, J., Deng, J., Zhang, J., Qiu, S., Zhang, W.2026-03-06💻 bioinformatics