La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

MoCoO: Momentum Contrast ODE-Regularized VAE for Single-Cell Trajectory Inference and Representation Learning

Il paper presenta MoCoO, un framework modulare che integra Variational Autoencoder, Neural ODE e Momentum Contrast, potenziato da un raffinamento tramite Flow Matching, per migliorare l'inferenza delle traiettorie cellulari e la rappresentazione dei dati scRNA-seq, dimostrando attraverso un'estesa valutazione su 20 dataset che questa combinazione architettonica e il raffinamento FM ottimizzano significativamente la geometria del clustering e la qualità dell'embedding.

Fu, Z.2026-03-31💻 bioinformatics

Structured Pooling Improves Detection of Rare Regulatory Mutations in Population-Scale Reporter Assays

Questo studio presenta un esperimento STARR-seq su scala di popolazione di 100 individui, che utilizza un design sperimentale di pooling strutturato e un modello bayesiano per migliorare l'accuratezza nella rilevazione e nella stima degli effetti delle rare mutazioni regolatorie non codificanti.

Dura, K., Siklenka, K., Strouse, K. P., Morrow, S., Zhang, C., Barrera, A., Allen, A. S., Reddy, T. E., Majoros, W. H.2026-03-31💻 bioinformatics

Cell type composition drives patient stratification in single-cell RNA-seq cohorts

Lo studio dimostra che la stratificazione dei pazienti nei cohort di scRNA-seq è guidata principalmente dalle proporzioni delle cellule, suggerendo che metodi semplici basati sulla composizione cellulare, implementati nel pacchetto R open-source scECODA, superano approcci più complessi offrendo allo stesso tempo maggiore interpretabilità e robustezza.

Halter, C., Andreatta, M., Carmona, S.2026-03-31💻 bioinformatics

Protein Language Model Decoys for Target Decoy Competition in Proteomics: Quality Assessment and Benchmarks

Questo studio valuta l'uso di modelli linguistici proteici (PLM) per la generazione di decoy nella proteomica, dimostrando che, sebbene offrano vantaggi nella riduzione degli artefatti sequenziali e siano utili per il benchmarking e il test di stress, non superano attualmente i decoy inversi classici nelle prestazioni complessive di identificazione dei peptidi.

Reznikov, G., Kusters, F., Mohammadi, M., van den Toorn, H. W. P., Sinitcyn, P.2026-03-31💻 bioinformatics

Pan-Metabolomics Repository Mapping of the Carnitine Landscape

Questo studio ha creato un vasto archivio di spettrometria di massa per le carnitine analizzando dati da più repository, identificando migliaia di nuove strutture chimiche e fornendo una risorsa fondamentale per esplorare il loro ruolo nel metabolismo, nella dieta e nelle malattie.

Mannochio-Russo, H., Ferreira, P. C., Kvitne, K. E., Patan, A., Deleray, V., Agongo, J., Gouda, H., Goncalves Nunes, W. D., Xing, S., Zemlin, J., van Faassen, M., Reilly, E. R., Koo, I., Patterson, A. (…)2026-03-31💻 bioinformatics

Carafe2 enables high quality in silico spectral library generation for timsTOF data-independent acquisition proteomics

Questo studio presenta Carafe2, un nuovo strumento software basato su deep learning che genera librerie spettrali *in silico* di alta qualità e specifiche per l'esperimento direttamente dai dati grezzi timsTOF DIA, superando le prestazioni dei modelli preaddestrati su dati DDA e migliorando l'identificazione e la quantificazione dei peptidi in diverse applicazioni proteomiche.

Wen, B., Paez, J. S., Hsu, C., Canzani, D., Chang, A. T., Shulman, N., MacLean, B. X., Berg, M. D., Villen, J., Fondrie, W., Pino, L., MacCoss, M. J., Noble, W. S.2026-03-31💻 bioinformatics