VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Il paper presenta VQA-MHUG, un nuovo dataset di sguardo umano multimodale che dimostra per la prima volta come una maggiore correlazione tra l'attenzione dei modelli neurali e quella umana sul testo sia un predittore significativo delle prestazioni nel Visual Question Answering, suggerendo la necessità di migliorare i meccanismi di attenzione testuale nelle architetture visione-linguaggio.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Reproduction and Replication of an Adversarial Stylometry Experiment

Questo studio riproduce e replica un esperimento fondamentale sulla stilometria avversariale, concludendo che le difese contro l'attribuzione dell'autore potrebbero essere sovrastimate a causa della mancanza di un gruppo di controllo, mentre evidenzia la necessità di riesaminare il metodo automatico di traduzione andata e ritorno per la sua capacità di ridurre l'efficacia delle tecniche di attribuzione.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

Il paper presenta FiADD, un nuovo framework che migliora il rilevamento dell'odio implicito e di altre forme di comunicazione indiretta potenziando i modelli linguistici preaddestrati attraverso un'infusione inferenziale focalizzata e una discriminazione di densità trattabile per avvicinare le forme superficiali a quelle implicite e massimizzare la separazione tra le classi.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Questo studio presenta un modello statistico per stimare la frazione di testo generato o modificato da LLM nelle revisioni paritarie di conferenze sull'intelligenza artificiale, rivelando che tra il 6,5% e il 16,9% del contenuto potrebbe essere influenzato da ChatGPT, con una correlazione significativa tra l'uso di tali strumenti e fattori come la bassa confidenza, la vicinanza alla scadenza e la riluttanza a rispondere alle obiezioni degli autori.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Il paper presenta NutriBench, il primo dataset pubblico di descrizioni di pasti verificati da umani e annotati con dati nutrizionali, utilizzato per valutare le prestazioni di diversi modelli linguistici di grandi dimensioni (LLM) nella stima dei carboidrati, dimostrando che possono offrire stime comparabili a quelle dei nutrizionisti ma con maggiore velocità e analizzando il loro impatto potenziale sulla gestione del diabete.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI