La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Experimental Time Points Guided Transcriptomic Velocity Inference

Il paper presenta CellDyc, un framework di apprendimento semi-supervisionato che integra i punti temporali sperimentali per inferire con precisione le velocità trascrizionali e ricostruire dinamiche cellulari longitudinali, superando i limiti dei metodi esistenti in contesti biologici complessi.

Zang, X., Shu, X., Zhang, N., Wu, Y., Deng, M., Zhou, X., Yang, J., Zhang, C.-Y., Wang, X., Zhou, Z., Wang, J.2026-02-19💻 bioinformatics

Identification of an ERCC2 mutation associated mutational signature of nucleotide excision repair deficiency in targeted panel sequencing data

Questo studio sviluppa e convalida una firma mutazionale composita basata su pannelli di sequenziamento mirato per identificare la carenza di riparazione per escissione di nucleotidi associata a mutazioni ERCC2, dimostrando che tale firma non solo predice una migliore risposta alla terapia con platino e una sopravvivenza globale superiore nei tumori della vescica, ma è anche presente in altri tumori solidi, suggerendo nuove strategie terapeutiche trasversali.

Stojkova, O., Borcsok, J., Sztupinszki, Z., Diossy, M., Prosz, A., Neil, A., Mouw, K. W., Sorensen, C. S., Szallasi, Z.2026-02-19💻 bioinformatics

NanoHIVSeq: A Long-Read Bioinformatics Pipeline for High-Throughput Processing of HIV Env Sequences

Il paper presenta NanoHIVSeq, una pipeline bioinformatica senza UMI e senza riferimento che sfrutta la tecnologia di sequenziamento duplex di Oxford Nanopore per elaborare in modo efficiente, accurato e riproducibile le varianti funzionali del gene Env dell'HIV-1 da dati di sequenziamento a lettura lunga, superando le limitazioni dei metodi tradizionali ad alto throughput.

Sheng, Z., Xiao, Q., Qiao, Y., Lu, H., McWhirter, J., Sagar, M., Wu, X.2026-02-19💻 bioinformatics

Benchmarking Large Language Models for Predicting Therapeutic Antisense Oligonucleotide Efficacy

Questo studio valuta le prestazioni di diversi modelli linguistici di grandi dimensioni nel prevedere l'efficacia terapeutica degli oligonucleotidi antisenso, dimostrando che l'approccio basato sull'ingegneria dei prompt con sequenze di DNA e informazioni sui geni bersaglio supera l'uso delle rappresentazioni SMILES, con GPT-3.5-Turbo che ottiene i migliori risultati nei contesti di apprendimento con pochi esempi.

Wei, Z., Griesmer, S., Sundar, A.2026-02-19💻 bioinformatics

A Machine Learning and Benchmarking Approach for Molecular Formula Assignment of Ultra High-Resolution Mass Spectrometry Data from Complex Mixtures

Questo studio presenta un approccio basato sull'apprendimento automatico, che utilizza algoritmi come KNN, Decision Tree e Random Forest, per migliorare significativamente l'assegnazione delle formule molecolari nei dati di spettrometria di massa ad altissima risoluzione di miscele complesse rispetto ai metodi tradizionali, rendendo disponibili pubblicamente il nuovo dataset e il codice sorgente come benchmark.

Shabbir, B., Oliveira, P. B., Fernandez-Lima, F., Saeed, F.2026-02-19💻 bioinformatics

ModCRElib: A standalone package to model cis-regulatory elements.

Il pacchetto ModCRElib è uno strumento autonomo che utilizza informazioni strutturali per analizzare e modellare le interazioni tra fattori di trascrizione e DNA, permettendo di prevedere i siti di legame, generare profili di affinità e simulare complessi regolatori di ordine superiore in modo flessibile e personalizzabile.

Gohl, P., Fornes, O., Bota, P. M., Messeguer, A., Bonet, J., Molina-Fernandez, R., Planas-Iglesias, J., Hernandez, A. C., Gallego, O., Fernandez-Fuentes, N., Oliva, B.2026-02-19💻 bioinformatics

A single-cell atlas linking intratumoral states to therapeutic vulnerabilities across cancers

Questo studio presenta il Therapeutic Cancer Cell Atlas (TCCA), una risorsa pan-cancro basata su 1,8 milioni di trascritomi che collega stati subclonali intratumorali e contesti microambientali alle vulnerabilità terapeutiche, superando la diversità genomica per identificare programmi trascrizionali funzionali che guidano la risposta ai farmaci e le strategie di medicina di precisione.

Gonzalez-Bermejo, M., Serrano-Ron, L., Garcia-Martin, S., Lapuente-Santana, O., Sanz-Portillo, I., Gonzalez-Martinez, P., Gomez-Lopez, G., Al-Shahrour, F.2026-02-19💻 bioinformatics