La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Relationship Between Gene Expression and Drug Response in Triple-Negative Breast Cancer: Leveraging Single-Cell RNA Sequencing and Machine Learning to Identify Biomarker Profiles

Questo studio integra dati di sequenziamento RNA a singola cellula e tecniche di machine learning interpretabile per identificare firme biomolecolari, sia tumorali che ematiche, in grado di predire con alta accuratezza la risposta terapeutica nel carcinoma mammario triplo negativo.

Mohammadi, K., Afhami, N., Saniotis, A., Henneberg, M., Bagheri, M., Kavousi, K.2026-03-08💻 bioinformatics

Deciphering Cell Cycle Dynamics and Cell States in Single-cell RNA-seq data with SPAE

Il paper presenta SPAE, un modello basato su autoencoder che migliora l'accuratezza e la robustezza nell'identificazione delle dinamiche del ciclo cellulare e degli stati delle cellule nei dati di RNA-seq a singola cellula, consentendo anche la previsione delle transizioni cicliche nelle cellule tumorali e la rimozione degli effetti del ciclo cellulare.

Yi, J., Liu, J., Guo, P., Ye, Y.-n., zhou, X.2026-03-08💻 bioinformatics

REMAG: recovery of eukaryotic genomes from metagenomic data using contrastive learning

Il paper presenta REMAG, un nuovo strumento basato sull'apprendimento contrastivo e su modelli genomici fondazionali che supera le limitazioni delle pipeline attuali per recuperare genomi eucariotici di alta qualità da dati metagenomici a lettura lunga, ottenendo risultati superiori rispetto agli strumenti esistenti.

Gomez-Perez, D., Raguideau, S., Warring, S., James, R., Hildebrand, F., Quince, C.2026-03-08💻 bioinformatics

Genomic language models improve cross-species gene expression prediction and accurately capture regulatory variant effects in Brachypodium mutant lines

Gli autori hanno sviluppato modelli di deep learning basati su embeddings contestuali del modello linguistico genomico PlantCaduceus che, superando le tecnologie esistenti, migliorano significativamente la previsione dell'espressione genica tra specie vegetali e la capacità di catturare gli effetti delle varianti regolatorie a risoluzione singola in linee mutanti di Brachypodium.

Vahedi Torghabeh, B., Moslemi, C., Dybdal Jensen, J., Hentrup, S., Li, T., Yu, X., Wang, H., Asp, T., Ramstein, G. P.2026-03-07💻 bioinformatics

Re-analysis of Transcriptomic and Proteomic Data Using Multi-Omics Approaches Identifies Biomarkers of Diabetes-Associated Complications in an INS Mutant Pig Model

Questo studio ri-analizza dati trascrittomici e proteomici del modello suino di diabete MIDY utilizzando approcci multi-omici per identificare ADAMTS17 come nuovo biomarcatore associato alla disfunzione immunitaria e al ritardo nella guarigione delle ferite.

Kota, K. P., Abbasi, B. A., Kajla, P., Tripathi, S., Bailey, A., Varma, B.2026-03-07💻 bioinformatics

Inverse Protocol Prediction from Spheroid Microscopy Imaging via Morphology-Aware Structured Learning

Il paper introduce Inverse Protocol Prediction (IPP), un framework di apprendimento strutturato che infere le condizioni sperimentali di coltura da immagini microscopiche di sferoidi, integrando descrittori morfometrici e trasformatori multi-task per raggiungere un'accuratezza del 95,7% e supportare l'audit della riproducibilità.

Mittal, P., Srivastava, A., Chauhan, J.2026-03-07💻 bioinformatics

SR2P: an efficient stacking method to predict protein abundance from gene expression in spatial transcriptomics data

Il paper presenta SR2P, un innovativo framework di machine learning basato su stacking che prevede l'abbondanza proteica spaziale a partire dai dati di espressione genica, superando i limiti delle attuali tecnologie multi-omiche e migliorando l'analisi dell'immunologia tumorale.

Wang, Q., Gao, A., Li, Y., Khatri, P., Hu, R., Huang, J., Pawitan, Y., Vu, T. N., Dinh, H. Q.2026-03-07💻 bioinformatics