La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Stoic: Fast and accurate protein stoichiometry prediction

Il paper presenta Stoic, un metodo rapido e accurato che utilizza embedding di modelli linguistici proteici e reti neurali a grafo per prevedere la stechiometria dei complessi proteici identificando direttamente i residui interfacciali, superando così i limiti computazionali degli approcci attuali.

Litvinov, D., Pantolini, L., Skrinjar, P., Tauriello, G., McCafferty, C. L., Engel, B. D., Schwede, T., Durairaj, J.2026-03-16💻 bioinformatics

Introducing non-enzymatic crosslinks into atomistic simulations of collagen fibrils

Gli autori estendono il framework ColBuilder per generare modelli atomistici di fibrille di collagene che incorporano sia legami incrociati enzimatici che non enzimatici (AGE), fornendo parametri compatibili con Amber99 e dimostrando, tramite simulazioni di dinamica molecolare, come i legami AGE influenzino diversamente la risposta meccanica rispetto a quelli enzimatici.

Giannetti, G., Pils, J., Graeter, F., Monego, D., Dellago, C.2026-03-16💻 bioinformatics

Survey of the human proteostasis network: the ubiquitin-proteasome system

Questo studio fornisce un'analisi completa del sistema ubiquitina-proteasoma e della rete di proteostasi nell'uomo, stimando che coinvolga oltre 1400 proteine specifiche e più di 3100 componenti complessivi, inclusi chaperoni molecolari e vie autofagiche, per supportare ricerche in genetica, biologia cellulare e medicina.

Elsasser, S., Powers, E., Stoeger, T., Sui, X., Kurtzbard, R. D., Martinez-Botia, P., Wangaline, M. A., Gama, A. R., Huttlin, E. L., Elia, L. P., Kelly, J. W., Gestwicki, J. E., Frydman, J. E., Finkbe (…)2026-03-16💻 bioinformatics

LysinFusion: Integrating Multi-Feature Encoding and Hybrid CNN-Transformer Architecture for Phage Lysin Prediction

LysinFusion è un nuovo framework di deep learning riproducibile che combina codifiche multi-caratteristica e un'architettura ibrida CNN-Transformer per identificare con alta precisione i lisini dei fagi, superando i metodi esistenti e riducendo i falsi positivi per accelerare la scoperta di terapie contro la resistenza antimicrobica.

He, S., Lu, H., Yao, Z., Cai, Y., Zhou, F., Feng, X., Cai, Y., Li, F.2026-03-16💻 bioinformatics

Machine Learning Reveals Intrinsic Determinants of siRNA Efficacy

Questo studio presenta un modello di machine learning che, analizzando 2.428 siRNA validati sperimentalmente, predice con alta accuratezza la loro efficacia basandosi esclusivamente su caratteristiche intrinseche della sequenza, identificando i nucleotidi specifici alle estremità come determinanti chiave e offrendo un approccio interpretabile per la progettazione razionale di siRNA a scopo terapeutico e agricolo.

Mandelli, C., Crippa, G., Jali, S.2026-03-15💻 bioinformatics

Scaling the PBWT for Long-Range Shared Ancestry Detection in Large Haplotype Panels

Il paper introduce PBML, un nuovo algoritmo basato sul PBWT compresso che identifica in modo efficiente e scalabile solo i segmenti di discendenza condivisa biologicamente significativi (SMEMs lunghi e frequenti) in grandi pannelli di aplotipi, superando in velocità e riducendo il rumore computazionale rispetto agli strumenti esistenti.

Islam, U. I., Cozzi, D., Gagie, T., Varki, R., Colonna, V., Garrison, E., Bonizzoni, P., Boucher, C.2026-03-15💻 bioinformatics

Bayesian AMMI-Based Simulation of Genotype x Environment Interactions

Il paper propone un framework di simulazione basato sul modello AMMI bayesiano che, integrando matrici di covarianza ambientale ad alta produttività, genera effetti di interazione genotipo-ambiente con struttura direzionale interpretabile, migliorando così le strategie di selezione genomica in condizioni ambientali complesse.

Lee, H., Segae, V. S., Garcia-Abadillo, J., de Oliveira Bussiman, F., Trujano Chavez, M. Z., Hidalgo, J., Jarquin, D.2026-03-15💻 bioinformatics