SpiroLLM: Finetuning Pretrained LLMs to Understand Spirogram Time Series with Clinical Validation in COPD Reporting

Il paper presenta SpiroLLM, il primo modello linguistico multimodale in grado di analizzare le serie temporali degli spirogrammi per generare rapporti diagnostici interpretabili e clinicamente validati per la BPCO, superando le limitazioni dei modelli attuali grazie all'integrazione di segnali fisiologici e dati testuali.

Shuhao Mei, Yongchao Long, Xiaoyu Xiao + 6 more2026-03-03💬 cs.CL

BinaryShield: Cross-Service Threat Intelligence in LLM Services using Privacy-Preserving Fingerprints

Il paper presenta BinaryShield, il primo sistema di intelligence sulle minacce che preserva la privacy, permettendo la condivisione sicura di impronte digitali degli attacchi tra servizi LLM separati da confini normativi tramite una pipeline innovativa che combina redazione PII, embedding semantico, quantizzazione binaria e risposta randomizzata, ottenendo prestazioni superiori rispetto alle soluzioni esistenti.

Waris Gill, Natalie Isak, Matthew Dressman2026-03-03💬 cs.CL

Actions Speak Louder than Prompts: A Large-Scale Study of LLMs for Graph Inference

Questo studio su larga scala dimostra che l'uso dei grandi modelli linguistici come generatori di codice supera le strategie di prompting tradizionali per l'inferenza su grafi, offrendo prestazioni superiori su dati complessi e sfatando il mito del loro fallimento in grafi eterofili, mentre la loro capacità di adattamento flessibile tra struttura, attributi e etichette fornisce linee guida fondamentali per futuri approcci.

Ben Finkelshtein, Silviu Cucerzan, Sujay Kumar Jauhar + 1 more2026-03-03💬 cs.CL

What Are They Filtering Out? An Experimental Benchmark of Filtering Strategies for Harm Reduction in Pretraining Datasets

Questo studio presenta un benchmark sperimentale che rivela come le strategie di filtraggio dei dati, sebbene efficaci nel ridurre i contenuti dannosi per la sicurezza dei modelli linguistici, abbiano l'effetto collaterale di aumentare la sottorappresentazione dei gruppi vulnerabili alla discriminazione nei dataset di addestramento.

Marco Antonio Stranisci, Christian Hardmeier2025-02-17💬 cs.CL