La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

GAE-Δ: A Graph-Learning Framework for Gene Network Rewiring and Clinical Outcome Prediction from Multi-Omics Data

Il framework GAE-Δ sfrutta un autoencoder grafico per modellare il rimodellamento delle reti geniche specifico del fenotipo attraverso dati multi-omici, ottenendo una previsione degli esiti clinici superiore e identificando driver del cancro biologicamente rilevanti rispetto ai metodi esistenti basati sulla fattorizzazione lineare e sulle reti.

Tang, Z., Chen, Z., Chen, M., Wang, Y., Ennis, S., Niranjan, M., Ewing, R.2026-05-26💻 bioinformatics

Decoding Multicellular Communication Motifs from Spatial Transcriptomics with ALARMIST

Il documento introduce ALARMIST, un framework probabilistico che decodifica motivi di comunicazione multicellulare interpretabili dai dati di trascrittomica spaziale per identificare pattern di segnalazione di ordine superiore e i loro impatti fenotipici a valle, dimostrandone l'utilità nel rivelare i driver microambientali della progressione tumorale nell'adenocarcinoma polmonare e nel glioblastoma.

Fan, J., Hood, J., Strong, J., Quinn, J. F., Dai, Y., Data Science TeamLab,, Schein, A., Yu, K. K. H., Tansey, W.2026-05-26💻 bioinformatics

Integrated optimization of experimental and computational workflows improves genome recovery in long-read gut metagenomics

Questo articolo presenta un'ottimizzazione sistematica della piattaforma CycloneSEQ, integrando l'elaborazione sperimentale dei campioni con flussi di lavoro computazionali di assemblaggio per superare i limiti del sequenziamento a letture brevi e migliorare significativamente il recupero di genomi microbici completi da metagenomica intestinale a letture lunghe.

Hu, Y., Sun, L., Huang, Y., Jiang, F., Tong, X., Yang, J., Ju, Y., Yang, Z., Liufu, S., Hu, Y., Ma, W., Guo, R., Li, W., Zhang, T., Zhu, X., Zhang, Z.2026-05-26💻 bioinformatics

Characterizing homology-induced data leakage and memorization in genome-trained sequence models

Questo articolo rivela che la perdita di dati indotta dall'omologia gonfia sistematicamente le prestazioni dei modelli di sequenza addestrati sul genoma, portandoli a basarsi su associazioni memorizzate anziché su principi generalizzabili, e propone lo strumento hashFrag per abilitare una partizione dei dati consapevole dell'omologia, al fine di garantire una valutazione più affidabile e una migliore generalizzabilità del modello.

Rafi, A. M., Kiyota, B., Yachie, N., de Boer, C. G.2026-05-25💻 bioinformatics

Time-Resolved Phosphoproteomics-Guided BFS Beam Search Reveals Cell-Type-Specific EGFR Signaling Architectures and SHP2 Inhibitor-Induced Pathway Rewiring

Questo studio introduce un quadro computazionale sistematico che integra la fosfoproteomica risolta nel tempo con un algoritmo di Beam Search guidato da BFS per ricostruire reti di segnalazione EGFR specifiche per tipo cellulare, rivelando con successo come l'inibizione di SHP2 riconfiguri le architetture delle vie di segnalazione e guidi i meccanismi di resistenza adattiva.

Lee, H., Lee, G.2026-05-23💻 bioinformatics

Interpreting Omics Data Analysis with Large Language Models for Disease Target and Drug Discovery

Questo articolo introduce un framework Text-to-Target consapevole della provenienza che integra il recupero di modelli linguistici di grandi dimensioni vincolati allo schema con l'analisi di dati omici numerici per generare target di malattie e strategie di scoperta di farmaci interpretabili e pronti per l'audit, dimostrando una validazione significativa nella malattia di Alzheimer e nell'adenocarcinoma duttale pancreatico.

XU, Z., Chen, W., Ren, W., Xu, T., Amaechin, S., Khan, R., Chen, Y., Province, M., Payne, P., Li, F.2026-05-23💻 bioinformatics

Asymmetric Contrastive Objectives for Efficient Phenotypic Screening

Questo articolo introduce obiettivi contrastivi asimmetrici, inclusa una variante SPC ispirata geometricamente che incorpora metadati sperimentali come vettori di classe appresi, per estrarre efficientemente rappresentazioni di immagini per lo screening fenotipico che superano i metodi precedenti su più dataset e metriche, mantenendosi efficaci anche con dati e risorse computazionali limitati.

Nightingale, L., Tuersley, J., Warchal, S., Cairoli, A., Howes, J., Shand, C., Powell, A., Green, D., Strange, A., Howell, M.2026-05-22💻 bioinformatics

Rewriting protein alphabets with language models

Questo articolo introduce TEA, un nuovo alfabeto proteico a 20 lettere derivato da incorporamenti di modelli linguistici tramite apprendimento contrastivo, che consente una rilevazione rapida e sensibile di omologia remota in grado di competere con i metodi basati sulla struttura, sfruttando al contempo gli algoritmi di ricerca di sequenze esistenti.

Pantolini, L., Studer, G., Engist, L., Pudziuvelyte, I., Pommerening, F., Waterhouse, A. M., Bienert, S., Tauriello, G., Steinegger, M., Schwede, T., Durairaj, J.2026-05-22💻 bioinformatics

Widespread use of invalid statistical tests in biomedical machine learning

Questo articolo rivela che l'uso diffuso di test statistici invalidi che ignorano la dipendenza tra le fold della convalida incrociata nell'apprendimento automatico biomedico porta a tassi di falsi positivi gonfiati, spingendo gli autori a proporre il test SHARP come soluzione robusta e a fornire nuove linee guida di reporting per il confronto valido dei modelli.

Zeng, T., Li, H., Zhang, S., Tan, Y. Q., Tian, F., Orban, C., An, L., Che, W., Cheng, J., Chong, J. S. X., Dehestani, N., Dong, Z., Li, X., Li, Z., Lim, M. J. R., Lin, Y., Ling, Q., Ling, Z., Low, X. (…)2026-05-22💻 bioinformatics