La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Chemical Probes in Scientific Literature: Expanding and Validating Target-Disease Evidence

Questo studio sistematico su oltre 18 milioni di articoli dimostra che i sonde chimiche catalizzano la scoperta terapeutica anticipando i dati strutturati di 1-7 anni, rivelando nuove associazioni target-malattia ad alta affidabilità e fornendo una validazione funzionale cruciale per la priorità dei bersagli.

Adasme, M. F., Ochoa, D., Lopez, I., Do, H.-M.-A., McDonagh, E. M., O'Boyle, N. M., Leach, A. R., Zdrazil, B.2026-02-20💻 bioinformatics

How to gain valuable insight from scarce data with Machine Learning: a post-hoc explanation tool to identify biases in biological images classification

Questo studio dimostra che l'uso di strumenti di spiegazione post-hoc, come SHAP, permette di identificare bias nascosti nei modelli di machine learning addestrati su dati biologici scarsi (riconoscendo erroneamente i singoli individui invece dei processi di rigenerazione) e di estrarre comunque informazioni biologiche rilevanti, come la distinzione tra fasi temporali di guarigione, quando il compito è allineato alle capacità del dataset.

Bolut, C., Pacary, A., Pieruccioni, L., Ousset, M., Paupert, J., Casteilla, L., Simoncini, D.2026-02-20💻 bioinformatics

High-resolution population structure inference using genome-wide short tandem repeat variations

Questo studio presenta un quadro multi-modale che utilizza le variazioni dei ripetuti tandem corti (STR) a livello genomico, incluso un nuovo modello di fattorizzazione non negativa direzionale (dNMF), per inferire la struttura della popolazione umana con una risoluzione e una precisione superiore rispetto ai tradizionali polimorfismi a singolo nucleotide (SNP).

Xia, F., Baudis, M., Anisimova, M.2026-02-20💻 bioinformatics

Impact of Data Quality on Deep Learning Prediction of Spatial Transcriptomics from Histology Images

Lo studio dimostra che la qualità dei dati, in particolare la sparsità e il rumore nei dati molecolari e la risoluzione delle immagini, influenza più significativamente le prestazioni dei modelli di deep learning per la previsione dell'espressione genica spaziale rispetto alla modifica delle architetture, suggerendo che il miglioramento della qualità dei dati è una strategia fondamentale per superare le limitazioni tecnologiche specifiche.

Hallinan, C., Lucas, C.-H. G., Fan, J.2026-02-19💻 bioinformatics