La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

ExplainBind: Explainable Physicochemical Determinants of Protein-Ligand Binding via Non-Covalent Interactions

ExplainBind è un nuovo framework AI privo di struttura che prevede la probabilità di legame proteina-ligando, individua specifici residui di legame e decodifica i pattern di interazione non covalente per fornire intuizioni meccanicistiche nella scoperta di farmaci, superando i modelli black-box esistenti su bersagli diversificati e identificando con successo sia inibitori che attivatori con meccanismi funzionali distinti.

Meng, Z., Bai, Z., Yuan, K., Cheah, J. H., Jiang, W., Skepner, A., Leahy, K. J., Ounis, I., Oldham, W. M., Meng, Z., Xu, H., Loscalzo, J.2026-05-19💻 bioinformatics

Unlocking Open-Access Genomic and Transcriptomic Data: The First Bioinformatic Exploitation of Tunisian Durum Wheat Landraces Chili and Mahmoudi, Pioneering Data-Driven Research in North Africa

Questo studio presenta la prima analisi genomica e trascrittomica integrata di landraces di grano duro tunisino, rivelando che l'adattamento alle zone aride è guidato principalmente dal rimodellamento delle reti di stress da parte di regolatori trans piuttosto che da hotspot di selezione, identificando al contempo specifici meccanismi molecolari e sei target cromosomici per futuri programmi di miglioramento genetico.

Gdoura-Ben Amor, M., MATHLOUTHI, N. E. H., BELGUITH, I., DEROUICH, R.2026-05-19💻 bioinformatics

TransXplorer: An automated translational discovery platform for RNA-seq data

TransXplorer è una piattaforma web gratuita e senza necessità di registrazione che semplifica l'intero flusso di lavoro analitico RNA-seq — dalla elaborazione dei dati grezzi e la correzione automatica dei batch all'arricchimento funzionale, all'analisi di rete e all'integrazione per la scoperta clinica/farmacologica — in un unico ambiente unificato.

Verma, V. M., Oler, E., Syed, H., Han, S., Berjanskii, M., Mason, A. L., Wishart, D. S., Wong, G. K.-S.2026-05-19💻 bioinformatics

DistPCA: Tera-Scale Genomic PCA via Out-of-Core Distributed Parallelism

DistPCA è il primo framework C++ distribuito e fuori memoria che sfrutta il parallelismo multi-livello basato su MPI per superare i colli di bottiglia di memoria e I/O, consentendo un'analisi delle componenti principali altamente scalabile e accurata per dataset genomici su scala tera su sistemi a singolo e multi-nodo.

Mermigkis, G., Sofotasios, A., Kontopoulou, E.-M., Gallopoulos, E., Hadjidoukas, P.2026-05-19💻 bioinformatics

Multi-Scale Tri-Modal Histology Dataset Integrating Tumor Morphology, Immune Patterns, and Clinical Outcomes

Questo articolo introduce Prostate-TriMod, un nuovo dataset istologico tri-modale per il cancro alla prostata che integra morfologia multiscala ad alta risoluzione, mappe spaziali delle cellule immunitarie e esiti clinici per facilitare la ricerca avanzata sull'intelligenza artificiale multimodale e l'analisi prognostica.

Jung, K. J., Qiu, J., Cho, S., McDonough, E., Chadwick, C., Ghose, S., West, R. B., Brooks, J. D., Ginty, F., Machiraju, R., Mallick, P.2026-05-19💻 bioinformatics

Systematic cross-study assessment of RNA-Seq experimental workflows for plasma cell-free transcriptome profiling

Questo studio valuta sistematicamente 21.666 campioni di cfRNA-Seq plasmatico provenienti da molteplici ricerche per dimostrare che i fattori tecnici, in particolare la scelta del protocollo e la contaminazione da DNA genomico, prevalgono in modo schiacciante sulla variazione trascrittomica rispetto ai fenotipi biologici, stabilendo così linee guida basate su evidenze per standardizzare i flussi di lavoro e migliorare la riproducibilità della scoperta di biomarcatori.

Tuni, C., Asole, G., Monteagudo-Mesas, P., Rusu, E. C., Cabus, L., Gonzalez, L., Sanchez, L., Neto, B., Sanders, P., Weber, M., Lagarde, J.2026-05-18💻 bioinformatics

CatIF-RL: Activity-Oriented Enzyme Sequence Design by Steered Inverse Protein Folding

CatIF-RL è un nuovo framework che potenzia l'attività catalitica degli enzimi orientando un modello di ripiegamento inverso di diffusione per il denoising basato su grafi verso valori di kcat predetti più elevati mediante segnali di preferenza orientati all'attività e ottimizzazione della politica relativa ai gruppi, mantenendo al contempo la fedeltà strutturale e la compatibilità della sequenza.

Li, Y., Xiong, J., Zhang, Y., Cai, T., Fu, C., Li, S., Xu, W., Lyu, R., Chen, Z., Guo, Z., Gong, X., Wang, F.2026-05-18💻 bioinformatics

BiomniBench: Process-level Evaluation of LLM Agents for Real-world Biomedical Research

Il documento introduce BiomniBench, un nuovo framework di valutazione a livello di processo che valuta gli agenti LLM su compiti di ricerca biomedica reali mediante rubriche progettate da esperti, per superare i limiti delle valutazioni basate esclusivamente sugli esiti e rivelare fallimenti critici nel ragionamento e nella selezione dei metodi.

Qu, Y., Lu, Y., Tu, X., Zhang, S., She, T., Shaw, A. G., Shih, J.-H., Zhao, B., Shen, M., Yang, H., Yan, J., Zhang, R., Wu, X., Li, T., Zhou, B., Wang, N., Ma, A., Cong, L., Hu, X., Jiang, Y., Dong, J (…)2026-05-18💻 bioinformatics

Elab2ARC: A Browser-Based Workspace for Converting Free-Text Protocols into rich FAIR digital objects

elab2ARC è un ambiente di lavoro lato client basato sul browser che automatizza la conversione delle registrazioni del quaderno di laboratorio elettronico eLabFTW in testo libero in Contesti di Ricerca Annotati (ARC) conformi ai principi FAIR e con controllo delle versioni, per una condivisione e un archiviazione senza soluzione di continuità senza interrompere i flussi di lavoro quotidiani del laboratorio.

Zander, S., Zhou, X.-R., Kranz, A., Dumschott, K., Rocca-Serra, P., Weil, H. L., Tschoepke, M., Muehlhaus, T., Von Suchodoletz, D., Usadel, B.2026-05-18💻 bioinformatics