La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Nanoscale Material Size Shapes Distinct Immune Transcriptional States Under Physiological Flow

Lo studio dimostra che la dimensione dei nanomateriali e la complessità dell'esposizione modellano stati trascrizionali immunitari distinti e non lineari nelle cellule del sangue umano sottoposte a flusso fisiologico, rivelando meccanismi di adattamento cellulare specifici per tipo cellulare.

Kovacevic, V., Milivojevic Dimitrijevic, N., Mihailovich, M., Zivanovic, M., Ivanovic, M., Zivic, A., Jankovic, M. G., Kovacevic, A., Zmrzljak, U. P., Puac, F., Filipovic, N., Ljujic, B.2026-03-13💻 bioinformatics

SAMWOOD: An automated method to measure wood cells along growth orientation

Il paper presenta SAMWOOD, un metodo automatizzato basato sul modello Segment-Anything che, senza necessità di dataset di addestramento, segmenta le cellule del legno per analizzarne le proprietà anatomiche lungo l'orientamento di crescita, riducendo tempi e bias operatore con risultati più consistenti rispetto all'analisi manuale.

Verlingue, K., Brunel, G., Decombeix, A.-L., Ramel, M., Tresson, P.2026-03-13💻 bioinformatics

Multiscale conformational sampling of multidomain fusion proteins by a physics informed diffusion model

Questo studio presenta un modello di diffusione multiscale basato su una rete neurale grafica equivariante e arricchito da vincoli biofisici, in grado di campionare rapidamente e con alta fedeltà gli ampi ensemble conformazionali di proteine di fusione multidominio, superando i limiti computazionali delle simulazioni di dinamica molecolare tradizionali.

Su, Z., Wang, B., Wu, Y.2026-03-13💻 bioinformatics

Improving Local Ancestry Inference through Neural Networks

Questo lavoro presenta quattro nuovi metodi di inferenza dell'ascendenza locale basati su reti neurali (tra cui LSTM bidirezionali e Transformer) che, pur mostrando prestazioni elevate per l'admixture intercontinentale, evidenziano le sfide residue nei casi di admixture intracontinentale o distante, migliorando comunque le prestazioni complessive attraverso specifiche fasi di pre-elaborazione e smoothing.

Medina Tretmanis, J., Avila-Arcos, M. C., Jay, F., Huerta-Sanchez, E.2026-03-13💻 bioinformatics

SpliceSelectNet: A Hierarchical Transformer-Based Deep Learning Model for Splice Site Prediction

Il paper presenta SpliceSelectNet, un modello di deep learning basato su Transformer gerarchico che, integrando meccanismi di attenzione locali e globali, raggiunge prestazioni all'avanguardia nella previsione dei siti di splicing e nella rilevazione di splicing aberranti su sequenze genomiche fino a 100 kb, offrendo al contempo interpretabilità biologica per lo studio delle regolazioni a lunga distanza.

Miyachi, Y., Nakai, K.2026-03-12💻 bioinformatics

Fleming: An AI Agent for Antibiotic Discovery in Mycobacterium Tuberculosis

Fleming è un agente AI integrato che combina modelli discriminativi e generativi per identificare e progettare nuovi candidati farmacologici contro la tubercolosi, dimostrando un'elevata efficacia nel predire l'inibizione batterica e nel garantire profili ADMET favorevoli.

Wei, Z., Ektefaie, Y., Zhou, A., Negatu, D., Aldridge, B. B., Dick, T. B., Skarlinski, M., White, A., Rodriques, S. G., Hosseiniporgham, S., Parai, M., Flores, A., Inna, K. V., Zitnik, M., Sacchettini (…)2026-03-12💻 bioinformatics

Igniting full-length isoform analysis in single-cell and spatial RNA-seq data with FLAMESv2

Il documento presenta FLAMESv2, un pacchetto R/Bioconductor modulare e agnostico rispetto al protocollo, progettato per elaborare, analizzare e visualizzare dati di trascrittomica a singola cellula e spaziale a lettura lunga, facilitando così la caratterizzazione completa degli isoformi dell'RNA e della loro eterogeneità.

Wang, C., Prawer, Y. D. J., Voogd, O., Schuster, J., Pasquali, C., De Paoli-Iseppi, R., Li, A., Hallab, J., Tian, L., Peng, H., David, M., Du, M. R. M., Velasco, S., Garone, M. G., Dong, X., Zeglinski (…)2026-03-12💻 bioinformatics

Application of large language models to the annotation of cell lines and mouse strains in genomics data

Lo studio dimostra che l'uso di modelli linguistici di grandi dimensioni come GPT-4o, integrati con un flusso di lavoro di validazione umana, può migliorare significativamente l'efficienza e la qualità dell'annotazione automatica di ceppi di topi e linee cellulari nei dati genomici, pur non essendo ancora in grado di sostituire completamente la curatela manuale.

Rogic, S., Mancarci, B. O., Xu, B., Xiao, A., Yan, C., Pavlidis, P.2026-03-12💻 bioinformatics