La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Mapping spatial cell-cell communication programs by tailoring chains of cells for transformer neural networks

Il paper presenta scCChain, un framework basato su transformer che integra l'attività ligando-recettore in programmi di comunicazione spaziale risolti e localizza i punti caldi di interazione cellulare nei tessuti complessi, superando i limiti dei metodi esistenti attraverso l'analisi di catene di cellule.

Brunn, N., Guitart, L. C., Farhadyar, K., Fullio, C. L., Kailer, J., Vogel, T., Hackenberg, M., Binder, H.2026-03-20💻 bioinformatics

Systematic assessment of machine learning-based variant annotation methods for rare variant association testing

Questo studio valuta sistematicamente cinque metodi di annotazione basati sull'apprendimento automatico per i test di associazione delle varianti rare su dati del UK Biobank, fornendo linee guida pratiche per la selezione del metodo e un nuovo quadro distribuzionale per la calibrazione.

Aguirre, M., Irudayanathan, F. J., Crow, M., Hejase, H. A., Menon, V. K., Pendergrass, R. K., McCarthy, M. I., Fletez-Brant, K.2026-03-20💻 bioinformatics

Bacteriophage host prediction using a genome language model

Questo studio dimostra che l'utilizzo di un modello linguistico genomico preaddestrato (Evo2) per generare embedding di interi genomi consente di prevedere l'ospite dei batteriofagi in modo efficace come problema di recupero non supervisionato, offrendo prestazioni complementari che, se combinate con metodi basati su allineamento e k-mer, migliorano l'accuratezza complessiva della predizione.

WANG, Z., Arsuaga, J.2026-03-20💻 bioinformatics

PanXpress: Gene expression quantification with a pan-transcriptomic gapped k-mer index

PanXpress è un framework unificato e allineamento-free per l'analisi dell'espressione genica batterica che, costruendo direttamente un indice pan-trascrittomico basato su k-mers con spaziature, supera i limiti dei riferimenti a singolo ceppo offrendo maggiore precisione, velocità e capacità di catturare la diversità genetica in campioni misti rispetto agli strumenti esistenti.

Alves Ferreira, I., Zentgraf, J., Schmitz, J. E., Rahmann, S.2026-03-20💻 bioinformatics

Leveraging Large Language Models to Extract Prognostic Pathology Features in Ewing Sarcoma

Questo studio dimostra che l'uso di modelli linguistici di grandi dimensioni (LLM) per estrarre dati da referti patologici non strutturati è altamente accurato e ha permesso di identificare l'espressione di NSE e S100 come nuovi biomarcatori prognostici significativi per la stratificazione del rischio nel sarcoma di Ewing.

Huang, J., Batool, A., Gu, Z., Zhao, Z., Yao, B., Black, J., Davis, J., al-Ibraheemi, A., DuBois, S., Barkauskas, D., Ramakrishnan, S., Hall, D., Grohar, P., Xie, Y., Xiao, G., Leavey, P. J.2026-03-19💻 bioinformatics

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

Questo studio presenta il più ampio atlante trascritomico a singola cellula del macaco fascicolo (Macaca fascicularis) finora realizzato, armonizzato con annotazioni di un modello fondazionale umano per fornire una risorsa unificata che migliora la valutazione dei bersagli terapeutici e la comprensione dei meccanismi di tossicità, supportando così la riduzione e il perfezionamento dell'uso dei primati non umani nella ricerca preclinica.

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics