La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

GlyComboCLI enables command line-based FAIR workflows for glycan composition assignment in mass spectrometry data

GlyComboCLI è uno strumento flessibile a riga di comando e open-source che automatizza l'assegnazione della composizione glicanica per i dati di spettrometria di massa, consentendo flussi di lavoro bioinformatici scalabili e conformi ai principi FAIR che riducono significativamente l'interpretazione manuale garantendo al contempo risultati riproducibili.

Kelly, M. I., Thang, W. C. M., Pang, C. N. I., Gustafsson, O. J. R., Ashwood, C.2026-05-21💻 bioinformatics

A unified framework for batch correction and missing data handling in large-scale and single-cell mass spectrometry proteomics

Il documento introduce NMFBatch, un quadro statistico unificato che corregge simultaneamente gli effetti di batch discreti e la deriva del segnale continua, gestendo direttamente i valori mancanti nella proteomica spettrometrica di massa su larga scala e a singola cellula, preservando così la struttura biologica e riducendo la perdita di informazioni rispetto ai metodi esistenti.

Anwar, A. M., Bayoumi, S., Lahti, L., Coffey, E.2026-05-21💻 bioinformatics

ParaDISM: Precise mapping of short reads to genes with highly homologous regions

ParaDISM è una pipeline open-source che migliora la precisione dell'allineamento delle letture corte e della chiamata delle varianti in regioni genomiche altamente omologhe sfruttando allineamenti di sequenze multiple per identificare posizioni disambiguanti e affinando iterativamente le sequenze di riferimento, riducendo così in modo significativo gli artefatti di allineamento errato e le chiamate di varianti false rispetto agli allineatori standard.

Tzimotoudis, D., Farrugia, R., Zammit, J., Masini, M. C., Balestrucci, A., Carbott, F. B., Wettinger, S. B., Alexiou, P., Ciach, M. A.2026-05-21💻 bioinformatics

OmniCellAgent: An AI Scientist for Omic-Driven Scientific Discovery

OmniCellAgent è un framework di intelligenza artificiale multi-agente che recupera e integra autonomamente dataset eterogenei di sequenziamento dell'RNA a singola cellula con conoscenze prioritarie biomediche per generare ipotesi basate su evidenze e accelerare la scoperta scientifica guidata dall'omics per ricercatori non computazionali.

Huang, D., Li, H., Li, W., Zhang, H., Xu, T., Lu, Y., Fang, K., Xu, Z., Chen, J., Dickson, P., Sardiello, M., Buchser, W., Cooper, J. D., Cruchaga, C., Eghtesady, P., Li, G., Goedegebuure, P., DeNardo (…)2026-05-20💻 bioinformatics

Phylogenetically estimated neutral rates and fitness effects of mutations to influenza proteins

Costruendo alberi filogenetici da oltre 100.000 sequenze influenzali, questo studio stima i tassi di mutazione neutra e gli effetti sulla fitness specifici per sito in tutto il proteoma virale, rivelando una significativa variabilità tra i tipi di mutazione, forti correlazioni cross-virali con SARS-CoV-2 e HIV, e fornendo una risorsa completa e interattiva per comprendere come mutazione e selezione plasmino l'evoluzione dell'influenza in natura.

Haddox, H. K., Hinrichs, A. S., Jennings-Shaffer, C., Johnson, K., Benton, C. T., Galloway, J. G., Bloom, J. D., Matsen, F. A.2026-05-20💻 bioinformatics

CharacTERT: A machine learning tool for classifying hTERT missense variants

Gli autori hanno sviluppato CharacTERT, uno strumento di apprendimento automatico che integra caratteristiche di sequenza e strutturali per classificare accuratamente le varianti missenso di hTERT associate a disturbi della biologia dei telomeri, superando i predittori esistenti e fornendo un panorama mutazionale completo tramite un server web liberamente accessibile.

Becerra Parra, G., Pan, Q., Myung, Y., Portelli, S., Nelson, N. E., Dickinson, J. L., Lucas, S. E. M., Holien, J. K., Bryan, T. M., Ascher, D. B.2026-05-20💻 bioinformatics

Shiny AMMOA: an interactive platform for integrative multi-omics analysis of murine aging

Questo articolo presenta Shiny AMMOA, una piattaforma interattiva R Shiny user-friendly che democratizza l'analisi multi-omica integrata dell'invecchiamento murino, consentendo ai ricercatori sperimentali di esplorare, visualizzare e generare ipotesi da dataset unificati di trascrittomica, proteomica e metabolomica senza richiedere competenze computazionali avanzate.

Ninomiya Kanda, M.2026-05-20💻 bioinformatics