bioinformatics articoli

La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Efficient Stochastic Trace Generation for Transcription

Questo articolo introduce **bcrnnoise**, un framework Python open-source che unifica deriva deterministica, fluttuazioni gaussiane e salti sporadici additivi in un unico modello di equazione differenziale stocastica per generare in modo efficiente tracciati di trascrizione accurati con una velocità computazionale fino a due ordini di grandezza superiore rispetto al campionamento stocastico esatto.

Ferdowsi, A., Fuegger, M., Nowak, T.2026-05-08💻 bioinformatics

SaVanache: indexing and visualizing pangenome variation graphs

SaVanache è uno strumento di visualizzazione multi-risoluzione che consente un'esplorazione efficiente e in tempo reale e un confronto intuitivo uno-a-molti di complessi grafici di variazione del pangenoma, pre-processando i file GFA in indici ottimizzati e utilizzando glifi specializzati per evidenziare le variazioni strutturali rispetto a un genoma pivot lineare.

Mohamed, M., Durant, E., Rouard, M., Muller, C., Monat, C., Conte, M., Sabot, F.2026-05-08💻 bioinformatics

Striping artifact removal in VisiumHD data through nuclear counts modeling

Questo articolo presenta un metodo statistico di destriping per i dati VisiumHD di 10x Genomics che modella i conteggi delle bin utilizzando la segmentazione dei nuclei e un modello lineare generalizzato regolarizzato per rimuovere efficacemente gli artefatti di rigatura moltiplicativi preservando i segnali biologici su larga scala, superando gli approcci di normalizzazione esistenti.

Malsot, P., Londschien, M., Boeva, V., Raetsch, G.2026-05-07💻 bioinformatics

SLiMNet: a deep learning model to detect short linear motifs using protein large language model representations and paired inputs

Il lavoro introduce SLiMNet, un modello di deep learning che sfrutta le rappresentazioni vettoriali di modelli linguistici di grandi dimensioni per le proteine e l'apprendimento contrastivo per prevedere le similarità funzionali tra motivi lineari corti (SLiM), consentendo così l'annotazione funzionale di motivi precedentemente non caratterizzati e fornendo atlanti completi di coppie funzionali potenziali per la comunità di ricerca.

McFee, M. C., Kim, P. M.2026-05-07💻 bioinformatics

ProtSpace: Protein Universe in Your Browser

ProtSpace è un'applicazione web basata su browser che preserva la privacy e consente la visualizzazione interattiva e l'esplorazione sistematica degli spazi di incorporamento dei modelli linguistici delle proteine, rivelando relazioni funzionali e strutturali complesse oltre la semplice similarità di sequenza tradizionale, grazie alla visualizzazione integrata di strutture 3D e ad annotazioni multi-etichetta.

Senoner, T., Vahidi, P., Olenyi, T., Senoner, F., Sisman, G., Kahl, E., Rost, B., Koludarov, I.2026-05-07💻 bioinformatics

Beyond Pathway Boundaries: A Degree-Aware Network Clustering Test for Gene Sets

Il documento introduce MANGO, un metodo innovativo di clustering delle reti che corregge il bias degli hub nell'analisi delle famiglie geniche condizionando alla distribuzione dei gradi, consentendo così una rilevazione robusta dell'autocorrelazione spaziale biologicamente significativa senza i falsi positivi intrinseci negli approcci tradizionali di sovrarappresentazione o negli approcci basati su reti ingenui.

Queme, B., Marjoram, P., Mi, H.2026-05-07💻 bioinformatics

geneSync: Gene Symbol Harmonization for Large-scale RNA-seq Data Integration

Il documento presenta geneSync, un pacchetto R che risolve le incongruenze nei simboli genici nei dati RNA-seq su larga scala mediante una strategia di corrispondenza gerarchica e database offline, migliorando significativamente l'integrazione tra dataset e la sovrapposizione delle caratteristiche.

Feng, Z., Li, T.2026-05-07💻 bioinformatics

Simple baselines rival protein language models in mutation-dense design tasks

Questo articolo dimostra che i metodi di baseline convenzionali performano quanto, o meglio di, i modelli linguistici delle proteine nel prevedere gli effetti di varianti proteiche dense di mutazioni, suggerendo che i pLM richiedano l'integrazione con prior biophysici o strutturali per avanzare efficacemente la progettazione delle proteine.

Talpir, I., Fleishman, S. J.2026-05-06💻 bioinformatics

PhenotypeToGeneDownloaderR: automated multi-source retrieval and validation of phenotype-associated genes

PhenotypeToGeneDownloaderR è una pipeline leggera e riproducibile in R/Python che automatizza il recupero, l'armonizzazione e la validazione dei geni associati ai fenotipi da molteplici database biologici eterogenei, ottenendo un'elevata sensibilità e dimostrando la complementarità delle fonti di evidenza integrate per l'analisi genetica a valle.

Muneeb, M., Ascher, D. B.2026-05-06💻 bioinformatics

Learning the Language of the Microbiome with Transformers

Questo articolo presenta Atlas, un dataset di pre-addestramento su larga scala per il microbioma, e la famiglia di modelli fondativi Waypoint, dimostrando attraverso il benchmark Compass che il pre-addestramento auto-supervisionato supera significativamente i metodi classici e i modelli esistenti in compiti diversificati di previsione del microbioma.

Treloar, N. J., Ur-Rehman, S., Yang, J.2026-05-06💻 bioinformatics

← Precedente Successivo →