bioinformatics articoli

La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

NovoTax: prokaryotic strain identification from mass spectrometry-based proteomics data

NovoTax è una pipeline end-to-end che identifica ceppi prokariotici e specie contaminanti direttamente dai dati di proteomica basata sulla spettrometria di massa, combinando tecniche di sequenziamento de novo e ricerca genomica per abilitare analisi proteomiche più approfondite.

Svedberg, D., Mateus, A.2026-04-06💻 bioinformatics

Multistage Machine Learning Reveals Circadian Gene Programs and Supports a Retina-Choroid Axis in Myopia Development

Questo studio utilizza l'apprendimento automatico multistadio per dimostrare che il timing circadiano, in particolare la finestra ZT8-ZT12, definisce finestre molecolari critiche nello sviluppo della miopia, rivelando un asse coordinato retina-corioide e programmi genici conservati tra specie che si traducono in reti neuroendocrine più complesse nell'uomo.

Watcharapalakorn, A., Poyomtip, T., Tawonkasiwattanakun, P., Dewi, P. K. K., Thomrongsuwannakij, T., Mahawan, T.2026-04-06💻 bioinformatics

sctrial: Participant-Level Differential Analysis for Longitudinal Single-Cell Experiments

Il documento presenta sctrial, un framework open source in Python per l'analisi differenziale a livello di partecipante in studi di RNA-seq a singola cellula longitudinali, che risolve il problema della pseudoreplicazione cellulare garantendo una quantificazione dell'incertezza più rigorosa e risultati statisticamente validi in contesti clinici e traslazionali.

Vasanthakumari, P., Valencia, I., Aghmiouni, M. R., Magana, B., Omar, M. N.2026-04-06💻 bioinformatics

Halo: a pretrained model for whole-cell segmentation from nuclei images in spatial transcriptomics

Halo è un modello preaddestrato che ricostruisce i confini cellulari completi integrando la morfologia nucleare con la distribuzione spaziale degli RNA, superando le strategie di espansione nucleare tradizionali e consentendo una segmentazione cellulare accurata e generalizzabile per la trascrittomica spaziale senza necessità di ulteriore addestramento.

Zhang, X., Zhuang, H., Ji, Z.2026-04-06💻 bioinformatics

From nucleotides to semantics: genomic representation learning via joint-embedding predictive architecture

Il paper presenta GenoJEPA, un framework di apprendimento rappresentazionale genomico basato sull'architettura joint-embedding predictive che, sostituendo la ricostruzione locale delle basi con l'allineamento semantico nello spazio latente, ottiene prestazioni superiori su 55 compiti downstream riducendo al contempo costi computazionali e parametri, rendendo possibile l'uso di classificatori leggeri senza GPU.

Wang, C., Qi, Q., Sun, H., Zhuang, Z., He, B., Liu, S., Liao, J., Wang, J.2026-04-06💻 bioinformatics

Looplook: An integrative suite for target assignment and functional annotation of chromatin interactions empowered by expression-aware refinement and connected components clustering

Il paper presenta Looplook, un suite integrato open-source in R che migliora l'assegnazione dei geni target e l'annotazione funzionale delle interazioni cromatiniche attraverso l'uso di clustering dei componenti connessi e un raffinamento guidato dall'espressione genica per ridurre i falsi positivi.

Zhang, Y., Huang, X., Chen, Y., Xu, L.2026-04-06💻 bioinformatics

Sequence-Driven Drug-Target Affinity Prediction Via Graph Attention Networks and Bidirectional Cross-Attention Fusion

Il paper presenta XAttn-DTA, un framework basato su sequenze che utilizza reti di attenzione su grafi e fusione incrociata bidirezionale per prevedere l'affinità farmaco-bersaglio senza dati strutturali sperimentali, ottenendo prestazioni superiori rispetto agli stati dell'arte su benchmark come Davis e KIBA.

Kudari, Z., Kaira, V. S., P, S. S., Bhat, R., Gnana Sekaran, J.2026-04-06💻 bioinformatics

Unravelling genome-wide mosaic microsatellite mutations at single-cell resolution

Gli autori hanno sviluppato l'algoritmo BayesMonSTR per rilevare con precisione le mutazioni mosaiche dei microsatelliti a risoluzione singola cellula, scoprendo che queste varianti si accumulano con l'età, specialmente nei neuroni della corteccia prefrontale, e sono arricchite nelle regioni regolatorie dei geni altamente espressi.

Wang, C., Fan, W., Wang, W., Xia, Y., Lu, J., Ma, X., Yu, J., Zheng, Y., Luo, Y., Li, W., Yang, Q., Lin, M., Liu, H., Lan, Y., Li, C., Liu, X., HE, D., Cai, S., Yu, X., Zhou, D., Kellis, M., Xiong, X. (…)2026-04-05💻 bioinformatics

Widespread data leakage inflates accuracy and corrupts biomarker discovery in cancer drug response prediction

Questo studio dimostra come la pratica diffusa di eseguire la selezione delle caratteristiche su tutti i campioni prima della convalida incrociata provochi una perdita di dati che gonfia artificialmente l'accuratezza dei modelli di previsione della risposta ai farmaci e corrompe la scoperta di biomarcatori nel cancro, portando a conclusioni errate in oltre il 70% dei metodi pubblicati.

Asiaee, A., Strauch, J., Azinfar, L., Pal, S., Pua, H. H., Long, J. P., Coombes, K. R.2026-04-05💻 bioinformatics

Comprehensive characterization of V(D)J recombination from long-read transcriptomic data with VDJcraft

Il documento presenta VDJcraft, la prima pipeline integrata per l'analisi accurata della ricombinazione V(D)J mediante dati di trascrittomica a lettura lunga, che supera i limiti degli strumenti esistenti consentendo la caratterizzazione precisa dei recettori antigenici e la scoperta di nuovi sottogruppi genici associati a patologie.

Hu, K., Rosenberg, A. F., Song, Y., Fan, C.-H., Peng, Z., Gao, M., Chong, Z.2026-04-05💻 bioinformatics

← Precedente Successivo →