SEM-CTRL\texttt{SEM-CTRL}: Semantically Controlled Decoding

Il paper presenta \texttt{SEM-CTRL}, un approccio unificato che integra la ricerca ad albero Monte Carlo a livello di token e le grammatiche di risposta logica per imporre vincoli sintattici e semantici durante il decoding dei LLM, garantendo così output validi senza necessità di fine-tuning e permettendo anche a modelli piccoli di superare le prestazioni di varianti più grandi.

Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo2026-03-04🤖 cs.AI

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

Il paper presenta HSSBench, un benchmark multilingue composto da oltre 13.000 campioni e sviluppato con un nuovo pipeline di generazione dati collaborativa, progettato per valutare e stimolare le capacità di ragionamento interdisciplinare dei Modelli Linguistici Multimodali nel campo delle Scienze Umane e Sociali, un'area attualmente sottorappresentata nelle valutazioni esistenti.

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

Search Arena: Analyzing Search-Augmented LLMs

Il paper introduce "Search Arena", un vasto dataset crowdsourced di oltre 24.000 interazioni multi-turno con modelli linguistici potenziati dalla ricerca web, che rivela come le preferenze degli utenti siano influenzate dalla quantità di citazioni e dalla tipologia di fonti, sottolineando al contempo l'importanza di integrare la ricerca esterna per migliorare l'affidabilità dei modelli.

Mihran Miroyan, Tsung-Han Wu, Logan King + 8 more2026-03-04💬 cs.CL