La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

A Resolution-Agnostic Geometric Transformer for Chromosome Modeling Using Inertial Frame

Il paper presenta InertialGenome, un nuovo framework basato su Transformer che utilizza un sistema di riferimento inerziale e codifiche posizionali geometriche per ricostruire in modo robusto e indipendente dalla risoluzione la struttura 3D dei cromosomi, superando le limitazioni dei metodi esistenti e migliorando le prestazioni nel trasferimento di apprendimento tra diverse risoluzioni.

Zhou, Y., Li, H., Liu, S.2026-03-05💻 bioinformatics

Single-Cell Omics for Transcriptome CHaracterization (SCOTCH): isoform-level characterization of gene expression through long-read single-cell RNA sequencing

Il paper presenta SCOTCH, una pipeline end-to-end e indipendente dalla piattaforma per la caratterizzazione di isoformi a livello di singola cellula tramite sequenziamento RNA a lettura lunga, che migliora l'identificazione e la quantificazione degli isoformi noti e di quelli nuovi rispetto ai metodi esistenti.

Xu, Z., Qu, H.-Q., Mu, S., Kao, C., Hakonarson, H., Wang, K.2026-03-04💻 bioinformatics

The FAIRSCAPE AI-readiness Framework for Biomedical Research

Il framework FAIRSCAPE è un ambiente digitale sviluppato per garantire che i dataset biomedici siano pronti per l'uso nell'intelligenza artificiale, fornendo metadati ricchi, tracciabilità completa e una valutazione automatizzata basata su criteri etici e di trasparenza.

Al Manir, S., Levinson, M. A., Niestroy, J., Churas, C., Sheffield, N. C., Sullivan, B., Fairchild, K., Torres, M. M., Ratcliffe, S. J., Parker, J. A., Ideker, T., Clark, T.2026-03-04💻 bioinformatics

HDMAX2-surv: high-dimensional mediation analysis of survival data with application to pancreatic cancer

Il paper presenta HDMAX2-surv, un nuovo framework statistico scalabile in R per l'analisi di mediazione ad alta dimensionalità su dati di sopravvivenza censurati, che integra modelli di fattori latenti e modelli di sopravvivenza flessibili per identificare percorsi epigenetici mediatori nell'adenocarcinoma pancreatico, superando le limitazioni dei metodi esistenti nella gestione di fattori di confondimento non osservati.

Pittion, F., Amblard, E., Devijver, E., Samson, A., Varoquaux, N., Richard, M.2026-03-04💻 bioinformatics

Sample-specific haplotype-resolved protein isoform characterization via long-read RNA-seq-based proteogenomics

Gli autori sviluppano un flusso di lavoro proteogenomico end-to-end che integra dati di sequenziamento RNA a lettura lunga (lrRNA-seq) e spettrometria di massa per costruire database proteici risolti per aplotipo specifici del campione, permettendo così l'identificazione di isoforme proteiche, varianti e splicing non rilevabili con i proteomi di riferimento.

Wissel, D., Sheynkman, G. M., Robinson, M. D.2026-03-04💻 bioinformatics

gSV: a general structural variant detector using the third-generation sequencing data

Il documento presenta gSV, un rilevatore generale di varianti strutturali che integra approcci basati su allineamento e assemblaggio per migliorare la sensibilità nella scoperta di varianti complesse, superando i limiti degli strumenti esistenti e dimostrando il proprio valore in studi genomici sul cancro al seno.

HAO, J., Shi, J., Lian, S., Zhang, Z., Luo, Y., Hu, T., Ishibashi, T., Wang, D., Wang, S., Fan, X., Yu, W.2026-03-04💻 bioinformatics

EvoStructCLIP: A Mutation-Centered Multimodal Embedding Model for CAGI7 Variant Effect Prediction

Il paper presenta EvoStructCLIP, un modello di embedding multimodale centrato sulle mutazioni che integra finestre strutturali 3D e vincoli evolutivi tramite apprendimento contrastivo, dimostrando elevata capacità predittiva e trasferibilità su varianti missenso in diversi contesti biologici e nella competizione CAGI7.

Chung, K., Lee, J., Kim, Y., Lee, J., Park, J., Lee, H.2026-03-04💻 bioinformatics

Towards Useful and Private Synthetic Omics: Community Benchmarking of Generative Models for Transcriptomics Data

Questo studio presenta un benchmark comunitario di 11 modelli generativi per dati di trascrittomica, evidenziando come la scelta del modello comporti inevitabili compromessi tra utilità predittiva, fedeltà biologica e resistenza agli attacchi di privacy.

Öztürk, H., Afonja, T., Jälkö, J., Binkyte, R., Rodriguez-Mier, P., Lobentanzer, S., Wicks, A., Kreuer, J., Ouaari, S., Pfeifer, N., Menzies, S., Pentyala, S., Filienko, D., Golob, S., McKeever, P (…)2026-03-04💻 bioinformatics

Deciphering the links between metabolism and health by building small-scale knowledge graphs: application to endometriosis and persistent pollutants

Il paper presenta Kg4j, un framework computazionale che costruisce sottografi di conoscenza localizzati partendo da FORVM per integrare dati sperimentali e generare ipotesi, dimostrando la sua efficacia nell'identificare meccanismi biologici e associazioni tra endometriosi ed esposizione a inquinanti organici persistenti.

Mathe, M., Laisney, G., Filangi, O., Giacomoni, F., Delmas, M., Cano-Sancho, G., Jourdan, F., Frainay, C.2026-03-04💻 bioinformatics