La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie è uno strumento curato e di facile utilizzo che impiega modelli di Markov nascosti personalizzati per ottenere una sensibilità significativamente superiore rispetto alle banche dati esistenti nel rilevamento di geni specifici per il substrato coinvolti nella degradazione aerobica e anaerobica dei BTEX, fornendo inoltre visualizzazioni integrate di pathway e genomiche per studi di genomica ambientale e comparativa.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

Questo studio rivela che TDP-43 regola la trascrizione genica e facilita l'interazione a lunga distanza della cromatina legandosi e stabilizzando le strutture G-quadruplex del DNA agli ancoraggi degli anse della cromatina, fornendo così una spiegazione meccanicistica della disregolazione genica nelle malattie associate alla disfunzione di TDP-43.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

Questo articolo introduce un quadro bayesiano modulare, esemplificato dal software Plasmotrack per *Plasmodium falciparum*, che ricostruisce reti di trasmissione dirette da infezioni policlonali accogliendo molteplici fonti genetiche e genitori non osservati per stimare metriche chiave di salute pubblica.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

Questo articolo presenta protocolli computazionali ed esempi pratici per automatizzare l'annotazione degli RNA non codificanti virali e recuperare programmaticamente i dati Rfam tramite la sua API RESTful, sfruttando al contempo R2DT per generare visualizzazioni complete della struttura 2D da integrare nei flussi di lavoro di bioinformatica e machine learning.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

Il documento introduce PXN, un framework di apprendimento automatico probabilistico che supera l'incompatibilità tra piattaforme nei dati pubblici di espressione genica traducendo in modo trasparente dataset diversificati (incluso il collegamento tra tecnologie microarray e RNA-seq) in una rappresentazione unificata, migliorando così significativamente l'accuratezza e il potere statistico delle analisi biologiche integrative su larga scala.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

Gli autori hanno sviluppato TriCyP, uno strumento basato su un modello linguistico delle proteine che prevede con precisione gli stati funzionali della cisteina (legami disolfuro, coordinazione metallica e tioli liberi) a partire da strutture predette, consentendo un catalogo su scala proteomica di 2,7 milioni di cisteine attraverso i domini ECOD che rivela modelli biologici distinti e identifica nuove famiglie leganti metalli e potenziali interazioni proteina-proteina.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

Il documento introduce Aiki-Sol, un predittore di solubilità proteica che supera il plateau prestazionale dei modelli esistenti considerando esplicitamente i regimi di centrifugazione come una caratteristica critica anziché come rumore, ottenendo significativi miglioramenti di accuratezza su un nuovo dataset di E. coli annotato per severità appena rilasciato.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

Questo articolo presenta un quadro specifico per il contesto che convalida insiemi di geni della risposta allo stress sfruttando reti di interazione proteina-proteina limitate ai geni differenzialmente espressi, dimostrando che i geni della "Risposta Principale" supportati biologicamente formano sottoreti significativamente interconnesse attraverso diverse condizioni termiche.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics