La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

iGS: A Zero-Code Dual-Engine Graphical Software for Polygenic Trait Prediction

Il paper presenta iGS, un software grafico "zero-code" basato su un'architettura a doppio motore portatile che integra 33 modelli predittivi avanzati per semplificare la selezione genomica agli allevatori, dimostrando attraverso test su dati del frumento che i modelli lineari sono robusti per tratti poligenici additivi mentre le architetture di machine learning e deep learning offrono prestazioni superiori per tratti complessi con bassa ereditabilità.

Zhang, J., Chen, F.2026-03-03💻 bioinformatics

Minimum Unique Substrings as a Context-Aware k-mer Alternative for Genomic Sequence Analysis

Questo studio introduce i Minimum Unique Substrings (MUSs) come alternativa contestuale e adattiva alle k-mers fisse per l'analisi genomica, offrendo una risoluzione superiore e una compressione dei dati più efficiente grazie alla loro capacità di variare di lunghezza in base alla complessità locale del genoma.

Adu, A. F., Menkah, E. S., Amoako-Yirenkyi, P., Pandam Salifu, S.2026-03-03💻 bioinformatics

h5adify: neuro-symbolic metadata harmonizationenables scalable AnnData integration with locallarge language models

Il paper presenta h5adify, un toolkit neuro-simbolico che integra inferenze biologiche deterministiche con modelli linguistici locali per armonizzare in modo scalabile e riproducibile i metadati eterogenei negli oggetti AnnData, risolvendo le inconsistenze semantiche e facilitando l'integrazione su larga scala dei dati di trascrittomica.

Rincon de la Rosa, L., Mouazer, A., Navidi, M., Degroodt, E., Künzle, T., Geny, S., Idbaih, A., Verrault, M., Labreche, K., Hernandez-Verdin, I., Alentorn, A.2026-03-03💻 bioinformatics

Improved prediction of virus-human protein-protein interactions by incorporating network topology and viral molecular mimicry

Questo studio presenta vhPPIpred, un metodo di apprendimento automatico che integra informazioni topologiche di rete e mimetismo molecolare virale per prevedere con maggiore accuratezza le interazioni proteina-proteina tra virus e umani, supportato da un nuovo dataset di riferimento curato e dimostrando elevate prestazioni in termini di efficienza e applicazioni pratiche nella scoperta di farmaci antivirali.

Zhang, Z., Feng, Y., Meng, X., Peng, Y.2026-03-03💻 bioinformatics

LLPSight: enhancing prediction of LLPS-driving proteins using machine learning and protein Language Models

LLPSight è un nuovo predittore basato su machine learning e modelli linguistici proteici che, addestrato su dataset rigorosamente curati, supera gli strumenti esistenti nell'identificazione delle proteine guida della separazione di fase liquido-liquido (LLPS) e permette analisi su scala proteomica per scoprire nuovi target sperimentali.

GONAY, V., VITALE, R., STEGMAYER, G., Dunne, M. P., KAJAVA, A. V.2026-03-03💻 bioinformatics

In Silico Screening of Indian Medicinal Herb Compounds for Intestinal α-Glucosidase Inhibition with ADMET and Toxicity Assessment for Postprandial Glucose Management in Type-2 Diabetes

Questo studio di screening *in silico* ha identificato fitochimici, in particolare conwithanolidi derivati da *Withania somnifera*, come potenziali inibitori dell'α-glucosidasi intestinale con affinità di legame superiore o paragonabile a quella del miglitol, suggerendo il loro utilizzo promettente per la gestione della glicemia postprandiale nel diabete di tipo 2.

Roy, D. A. C., GHOSH, D. I.2026-03-03💻 bioinformatics

Enabling Megascale Microbiome Analysis with DartUniFrac

Il paper introduce DartUniFrac, un algoritmo accelerato da GPU che calcola la similarità UniFrac su scala megascale (milioni di campioni e miliardi di taxa) con una velocità fino a tre ordini di grandezza superiore rispetto agli stati dell'arte, mantenendo un'accuratezza statisticamente indistinguibile dai metodi esatti.

Zhao, J., McDonald, D., Sfiligoi, I., Lladser, M. E., Patel, L., Weng, Y., Khatib, L., Degregori, S., Gonzalez, A., Lozupone, C., Knight, R.2026-03-03💻 bioinformatics