La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

Questo studio presenta il più ampio atlante trascritomico a singola cellula del macaco fascicolo (Macaca fascicularis) finora realizzato, armonizzato con annotazioni di un modello fondazionale umano per fornire una risorsa unificata che migliora la valutazione dei bersagli terapeutici e la comprensione dei meccanismi di tossicità, supportando così la riduzione e il perfezionamento dell'uso dei primati non umani nella ricerca preclinica.

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics

ProteinSage: From implicit learning to explicit structural constraints for efficient protein language modeling

Il paper introduce ProteinSage, un framework di pre-addestramento per modelli linguistici proteici che, integrando vincoli strutturali espliciti e segnali guidati dalla struttura, ottiene rappresentazioni trasferibili con meno dati e risorse, dimostrando la propria efficacia nell'identificare nuovi omologhi di rodopsine microbiche.

Shen, L., Chao, L., Liu, T., Liu, Q., Zhou, G., Wang, H., Dong, X., Li, T., Zhang, X., Ni, J.2026-03-19💻 bioinformatics

evedesign: accessible biosequence design with a unified framework

Il documento presenta evedesign, un framework open-source unificato e accessibile che supera la frammentazione degli attuali strumenti di ingegneria proteica consentendo la progettazione condizionale di biosequenze attraverso flussi di lavoro compositi, multi-obiettivo e iterativi integrabili con dati sperimentali.

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

Gli autori hanno sviluppato un flusso di lavoro guidato dalla struttura per identificare, classificare e rinominare sistematicamente tutte le 1.513 depositi di citocromo P450 nel Protein Data Bank, creando così il primo registro curato e accessibile pubblicamente che risolve le sfide legate alla divergenza sequenziale e alla nomenclatura inconsistente di questa superfamiglia enzimatica.

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

SELFormerMM: multimodal molecular representation learning via SELFIES, structure, text, and knowledge graph integration

Il paper introduce SELFormerMM, un framework di apprendimento multimodale che integra notazioni SELFIES, strutture molecolari, descrizioni testuali e dati di reti di interazione biologica per generare rappresentazioni molecolari più ricche e accurate, superando le prestazioni dei modelli unimodali esistenti in diverse attività di previsione delle proprietà.

Ulusoy, E., Bostanci, S., Deniz, B. E., Dogan, T.2026-03-19💻 bioinformatics