La bioinformatica è l'incontro vitale tra biologia e informatica, un campo che trasforma i dati biologici complessi in conoscenza comprensibile. Qui esploriamo come algoritmi e software aiutino gli scienziati a decifrare il codice della vita, dall'analisi del DNA alla scoperta di nuovi farmaci, rendendo accessibili scoperte che altrimenti rimarrebbero confinate in database tecnici.

Su Gist.Science, monitoriamo ogni nuovo preprint inviato da bioRxiv in questa categoria. Per ogni articolo, offriamo una doppia prospettiva: una spiegazione semplice per chiunque sia curioso e un riassunto tecnico dettagliato per i ricercatori. Questo approccio garantisce che le ultime novità scientifiche siano chiare, accurate e immediatamente disponibili.

Di seguito trovate i documenti più recenti pubblicati da bioRxiv nel settore della bioinformatica, pronti per essere esplorati nelle vostre forme più accessibili.

Systematic contextual biases in SegmentNT potentially relevant to other nucleotide transformer models

Questo articolo identifica e caratterizza i bias contestuali sistematici nel modello transformer nucleotidico SegmentNT, in particolare per quanto riguarda la lunghezza della sequenza di input, la posizione del nucleotide e un'oscillazione periodica di 24 nucleotidi legata alla tokenizzazione, e propone metodi di standardizzazione per migliorare la coerenza delle previsioni e guidare l'uso di modelli genomici simili.

Ebbert, M. T. W., Ho, A., Page, M. L., Dutch, B., Byer, B. K., Hankins, K. L., Sabra, H., Aguzzoli Heberle, B., Wadsworth, M. E., Fox, G. A., Karki, B., Hickey, C., Fardo, D. W., Bumgardner, C., Jakub (…)2026-05-05💻 bioinformatics

MilliMap: interactive closed-loop analysis for spatial omics

MilliMap è un framework interattivo che unifica il calcolo statistico e l'esplorazione spaziale per abilitare un'analisi iterativa a ciclo chiuso dei dati di omica spaziale, consentendo ai ricercatori di affinare i parametri e convalidare i risultati all'interno di un unico ambiente per applicazioni che spaziano dalla neuroanatomia ai microambienti tumorali.

Feng, Q., Qian, S. B., Wan, J., Starr, Z. R., Asif, S., Han, H.-S.2026-05-05💻 bioinformatics

SenNet Portal: Build, Optimization and Usage

Questo articolo presenta il SenNet Data Portal, una piattaforma ibrida scalabile su cloud che fornisce accesso aperto a dataset multimodali e multi-tessuto armonizzati e a strumenti analitici per caratterizzare sistematicamente la senescenza cellulare nei modelli umani e murini per la ricerca sull'invecchiamento.

Borner, K., Blood, P. D., Silverstein, J. C., Ruffalo, M., Satija, R., Gehlenborg, N., Honick, B., Bueckle, A., Jain, Y., Qaurooni, D., Shirey, B., Sibilla, M., Metis, K., Bisciotti, J., Morgan, R. S. (…)2026-05-04💻 bioinformatics

Do Larger Models Really Win in Drug Discovery?A Benchmark Assessment of Model Scaling in AI-Driven Molecular Property and Activity Prediction

Questo studio di benchmark sfida l'assunto che i modelli di intelligenza artificiale più grandi superino universalmente quelli più piccoli nella scoperta di farmaci, dimostrando che modelli compatti e specializzati raggiungono spesso una precisione predittiva superiore o paragonabile a quella dei grandi modelli fondazionali su una varietà di compiti relativi alle proprietà e all'attività molecolare.

Guo, J.2026-05-04💻 bioinformatics

AnnotateMissense: a genome-wide annotation and benchmarking framework for missense pathogenicity prediction

AnnotateMissense è un framework scalabile che integra caratteristiche genomiche e di modelli linguistici proteici diversificate per valutare e generare previsioni di patogenicità ad alte prestazioni per oltre 90 milioni di varianti missenso, ottenendo un'accuratezza superiore con un modello XGBoost addestrato su 132.714 varianti etichettate da ClinVar.

Muneeb, M., Ascher, D. B.2026-05-04💻 bioinformatics

AI-guided discovery of atypical protein assemblies

Gli autori hanno sviluppato l'Indice di Novità Strutturale (SNI), un framework basato sull'intelligenza artificiale che ha identificato con successo e validato sperimentalmente un inaspettato assemblaggio undecamero dei recettori immunitari NRC, dimostrando un metodo scalabile per la scoperta di complessi proteici atipici oltre le architetture canoniche.

Toghani, A., Seager, B. A., Sugihara, Y., Roijen, L.-M., Azcue, J. M., Garro, M., Sargolzaei, M., Morianou, I., Harant, A., Gallop, S., Kourelis, J., MacLean, D., Contreras, M. P., Kamoun, S., Lüdke (…)2026-05-04💻 bioinformatics

A 37-million-particle dataset from over 250 experiments to accelerate data-driven cryo-EM analysis

Il documento introduce cryoPANDA, un vasto dataset di oltre 37 milioni di particelle di criomicroscopia elettronica (cryo-EM) annotate provenienti da 252 esperimenti diversi, progettato per superare le attuali limitazioni dei dati e accelerare lo sviluppo di metodi basati sui dati per la biologia strutturale.

Zamanos, A., Kyrilis, F. L., Koromilas, P., Kastritis, P. L., Panagakis, Y.2026-05-03💻 bioinformatics

Modeling healthy proteomic profiles for anomaly detection using subspace learning based one-class classification

Questo articolo presenta un framework di classificazione a una classe basato su sottospazi interamente guidato dai dati che modella i profili proteomici plasmatici sani per rilevare in modo robusto diverse patologie senza richiedere campioni di addestramento malati, superando così le sfide dello squilibrio delle classi nei dati clinici ad alta dimensionalità.

Sohrab, F., Kumar, A., Ahola, V., Magis, A., Hautamaki, V., Heinaniemi, M., Huang, S.2026-05-01💻 bioinformatics

Hierarchical Breakdown of RNA Structure Prediction in CASP16: From Reliable Local Features to Speculative Multimer Assembly

Questo articolo presenta uno studio di caso CASP16 condotto da LCBio che dimostra come, sebbene i flussi di lavoro guidati da esperti possano ottenere classifiche competitive nella previsione di multimeri di RNA, i metodi attuali mostrano un declino gerarchico dell'accuratezza, in cui le caratteristiche locali affidabili non si traducono in architetture globali precise a causa delle persistenti sfide nella modellazione delle giunzioni multi-elica e delle interazioni non canoniche.

Nithin, C., Pilla, S. P., Kmiecik, S.2026-04-30💻 bioinformatics