cs.CL articoli | Gist.Science

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Il paper presenta VQA-MHUG, un nuovo dataset di sguardo umano multimodale che dimostra per la prima volta come una maggiore correlazione tra l'attenzione dei modelli neurali e quella umana sul testo sia un predittore significativo delle prestazioni nel Visual Question Answering, suggerendo la necessità di migliorare i meccanismi di attenzione testuale nelle architetture visione-linguaggio.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Multimodal Integration of Human-Like Attention in Visual Question Answering

Il paper presenta MULAN, il primo metodo che integra l'attenzione umana multimodale (sia visiva che testuale) nei modelli di Visual Question Answering, ottenendo nuovi record di accuratezza sul dataset VQAv2 con un numero di parametri addestrabili ridotto dell'80% rispetto alle tecniche precedenti.

Ekta Sood, Fabian Kögel, Philipp Müller + 3 more2026-03-04💬 cs.CL

Is Attention always needed? A Case Study on Language Identification from Speech

Questo studio presenta un modello di identificazione linguistica (LID) basato su CRNN che, utilizzando coefficienti MFCC, raggiunge un'accuratezza superiore al 98% su tredici lingue indiane e dimostra elevata robustezza al rumore, sollevando al contempo interrogativi sulla necessità universale dei meccanismi di attenzione in tali compiti.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Questo studio riproduce e replica un esperimento fondamentale sulla stilometria avversariale, concludendo che le difese contro l'attribuzione dell'autore potrebbero essere sovrastimate a causa della mancanza di un gruppo di controllo, mentre evidenzia la necessità di riesaminare il metodo automatico di traduzione andata e ritorno per la sua capacità di ridurre l'efficacia delle tecniche di attribuzione.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Statistical Machine Translation for Indic Languages

Questo articolo presenta lo sviluppo e la valutazione di modelli di traduzione statistica bilingue per il passaggio tra l'inglese e quindici lingue indiane a risorse limitate, utilizzando il toolkit MOSES, i dataset Samanantar e OPUS, e metriche standard come BLEU, METEOR e RIBES.

Sudhansu Bala Das, Divyajoti Panda, Tapas Kumar Mishra + 1 more2026-03-04💬 cs.CL

Verifying the Robustness of Automatic Credibility Assessment

Questo studio valuta la robustezza dei classificatori testuali contro attacchi avversariali, introducendo il benchmark BODEGA per quattro compiti di rilevamento della disinformazione e dimostrando che i modelli linguistici moderni sono spesso più vulnerabili rispetto alle soluzioni precedenti.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Questo studio propone l'uso di BERTimbau per prevedere i pittogrammi nei sistemi di comunicazione aumentativa e alternativa per il portoghese brasiliano, dimostrando che la rappresentazione dei pittogrammi tramite didascalie, sinonimi o definizioni offre prestazioni simili, con le didascalie che garantiscono la massima accuratezza.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

Il paper presenta FiADD, un nuovo framework che migliora il rilevamento dell'odio implicito e di altre forme di comunicazione indiretta potenziando i modelli linguistici preaddestrati attraverso un'infusione inferenziale focalizzata e una discriminazione di densità trattabile per avvicinare le forme superficiali a quelle implicite e massimizzare la separazione tra le classi.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Questo studio introduce BodoBERT, il primo modello linguistico per la lingua Bodo, e un modello di tagging delle parti del discorso basato su deep learning che combina BiLSTM-CRF e BodoBERT, raggiungendo un punteggio F1 di 0,8041.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Questo studio presenta un modello statistico per stimare la frazione di testo generato o modificato da LLM nelle revisioni paritarie di conferenze sull'intelligenza artificiale, rivelando che tra il 6,5% e il 16,9% del contenuto potrebbe essere influenzato da ChatGPT, con una correlazione significativa tra l'uso di tali strumenti e fattori come la bassa confidenza, la vicinanza alla scadenza e la riluttanza a rispondere alle obiezioni degli autori.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Il paper dimostra che, per i protocolli di broadcast non bloccanti Wait-Only, i problemi di copertura dello stato e della configurazione, noti per essere decidibili e di complessità Ackermann, diventano rispettivamente P-completi e PSPACE-completi.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

Topic-Based Watermarks for Large Language Models

Il paper propone uno schema di watermarking leggero e guidato dal tema per i grandi modelli linguistici che, partizionando il vocabolario in sottoinsiemi allineati semanticamente, garantisce robustezza contro gli attacchi e mantiene la qualità del testo senza richiedere framework aggiuntivi.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit

Uno studio su oltre 100 milioni di commenti Reddit dimostra che l'uso di "parole trigger" nel dibattito politico britannico è associato a un aumento significativo dell'engagement e dell'animosità, confermando il loro ruolo cruciale nel modellare la polarizzazione online.

Dimosthenis Antypas, Christian Arnold, Nedjma Ousidhoum + 2 more2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Il paper presenta NutriBench, il primo dataset pubblico di descrizioni di pasti verificati da umani e annotati con dati nutrizionali, utilizzato per valutare le prestazioni di diversi modelli linguistici di grandi dimensioni (LLM) nella stima dei carboidrati, dimostrando che possono offrire stime comparabili a quelle dei nutrizionisti ma con maggiore velocità e analizzando il loro impatto potenziale sulla gestione del diabete.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Questo articolo presenta MELODI, un framework e un dataset innovativi per monitorare e analizzare il consumo energetico durante l'inferenza dei modelli linguistici di grandi dimensioni, rivelando come le caratteristiche dei prompt influenzino l'efficienza energetica e sottolineando la necessità di ottimizzazioni per un'IA più sostenibile.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

Il paper introduce BA-LoRA, un metodo di adattamento a basso rango che mitiga l'eredità catastrofica nei grandi modelli linguistici attraverso regolarizzatori mirati, migliorando al contempo le prestazioni, la stabilità e l'equità rispetto alle varianti LoRA esistenti.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

OM4OV: Leveraging Ontology Matching for Ontology Versioning

Questo studio analizza le differenze tra l'allineamento e la versione delle ontologie, proponendo e validando una pipeline OM4OV con un meccanismo di cross-reference per ottimizzare il rilevamento delle modifiche e migliorare le prestazioni dei sistemi di allineamento esistenti.

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Questo studio analizza le cause della divergenza nelle preferenze umane, dimostrando che non sono semplici rumori ma derivano da fattori come l'indeterminazione del compito o lo stile di risposta, e propone metodi per mitigare tale impatto nella valutazione e nell'addestramento dei modelli linguistici.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

Il paper introduce Waffle, una nuova strategia di fine-tuning che utilizza meccanismi di attenzione strutturale e apprendimento contrastivo per migliorare la capacità dei modelli linguistici di generare codice HTML a partire da interfacce utente visive, ottenendo risultati superiori rispetto ai metodi attuali su benchmark specifici.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

Lo studio dimostra che ChatGPT può codificare efficacemente i dati comunicativi per la valutazione delle abilità di problem-solving collaborativo, sebbene le prestazioni varino in base al modello, al framework di codifica e alle caratteristiche del compito, fornendo così indicazioni pratiche per rendere scalabile tale analisi.

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL

← Precedente Successivo →