La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

linearPOA: A parallel, memory-efficient framework for Partial Order Alignment with linear space complexity

Questo articolo introduce linearPOA, un framework parallelo ed efficiente in termini di memoria che utilizza una strategia di divide et impera per ottenere una complessità spaziale lineare per l'allineamento a ordine parziale, riducendo significativamente il consumo di memoria rispetto agli algoritmi quadratici esistenti quando si gestiscono letture di sequenziamento ultra-lunghe e soggette a errori.

Wei, Y., Huang, Z., Zhang, P., Tian, Q., Li, Y., Zou, Q., Yu, L.2026-04-30💻 bioinformatics

Species-specific transformer models of bacterial gene order and content for genomic surveillance tasks

Questo studio introduce PanBART, un modello transformer specifico per specie addestrato sul contenuto e sull'ordine genico di *Escherichia coli* e *Streptococcus pneumoniae*, che ne dimostra la superiore capacità di apprendere in modo non supervisionato le strutture di popolazione, identificare lignaggi emergenti, prevedere l'acquisizione di geni di resistenza agli antibiotici e analizzare la co-selezione genica per compiti critici di sorveglianza genomica.

Horsfield, S. T., Wiatrak, M., McInerney, J. O., Bentley, S. D., Colijn, C., Lees, J. A.2026-04-30💻 bioinformatics

A Conditional Variational Autoencoder with QSAR-Guided Surrogate-Weighted Fine-Tuning and Cross-Entropy Optimization for Targeted Antimicrobial Peptide Generation

Questo articolo presenta una pipeline di autoencoder variazionale condizionale che integra un affinamento fine pesato da surrogati guidati da QSAR e un'ottimizzazione della cross-entropia per superare le sfide legate alla scarsità di dati e alla dipendenza circolare, generando con successo peptidi antimicrobici mirati con elevata efficacia predetta e proprietà strutturali favorevoli.

Castanon, I., Wan, F., de la Fuente, C., Pini, A., Falciani, C.2026-04-30💻 bioinformatics

Systems Pharmacology Reveals Type I Interferon and Myeloid-Like B Cell Reprogramming as Druggable Axes in Antiphospholipid Syndrome

Questo studio adotta un approccio di farmacologia sistemica integrativa per caratterizzare l'eterogeneità molecolare della sindrome antifosfolipidica, identificando la segnalazione dell'interferone di tipo I e la riprogrammazione delle cellule B di tipo mieloide come assi farmacologicamente sfruttabili chiave che consentono la stratificazione dei pazienti e il riposizionamento di terapie esistenti per la medicina di precisione.

Sun, B., Lu, Y., Liu, W., Wang, C.2026-04-30💻 bioinformatics

Deterministic retrieval recovers biomedical associations lost by language models

Il documento presenta BioChirp, un framework open-source che combina l'interpretazione delle query basata su LLM con il recupero deterministico basato su grafi per recuperare più associazioni biomediche con una maggiore riproducibilità rispetto ai sistemi convenzionali basati su LLM.

Halder, A., Singh, M., Kesarwani, R., Mathew, B., Bhattacharya, N., Chikhaliya, O., Motwani, D., Peela, S. C. M., Samanta, S., Muddemmanavar, P., Farooq, M., Ahuja, G., Sengupta, D.2026-04-29💻 bioinformatics

Explainable Prototype Booster: Enhancing Latent Representations of Foundation Models for Gene Expression Prediction

Il documento introduce l'EP-Booster (Explainable Prototype Booster), un metodo che integra conoscenze biologiche a priori nei modelli fondazionali per affinare le rappresentazioni latenti al fine di una previsione accurata e interpretabile dell'espressione genica a partire da immagini istologiche, superando così i limiti di costo e tempo della trascrittomica spaziale.

Li, C., Nguyen, Q.2026-04-29💻 bioinformatics

Accurate ab initio gene prediction in eukaryotes with Tiberius in multiple clades

Il documento introduce Tiberius, un predittore di geni ab initio basato sull'apprendimento profondo che raggiunge una precisione all'avanguardia e tempi di esecuzione significativamente più rapidi attraverso diversi cladi eucariotici grazie all'addestramento di modelli specifici per lignaggio, affrontando efficacemente gli attuali colli di bottiglia nell'annotazione del genoma.

Gabriel, L., Bruna, T., Kaur, A., Krishnan, A., Ortmann, F., Salamov, A., Talbot, S., Becker, F., Krieg, R., Wheat, C. W., Grigoriev, I. V., Stanke, M., Hoff, K. J.2026-04-28💻 bioinformatics

Modeling causal signal propagation in multi-omic factor space with COSMOS

Il paper presenta COSMOS+, un approccio che integra l'analisi fattoriale multi-omica con conoscenze meccanicistiche prioritarie per modellare la propagazione causale dei segnali e generare ipotesi meccanicistiche interpretabili sui driver delle malattie, come dimostrato nello studio della resistenza al cancro al seno.

Dugourd, A., Lafrenz, P., Mananes, D., Paton, V., Fallegger, R., Bai, Y., Kroger, A.-C., Turei, D., Li, Y., Trogdon, M., Nager, D., Deng, S., Shen, C., Lapek, J. D., Shtylla, B., Saez-Rodriguez, J.2026-04-24💻 bioinformatics