cs.CL papers | Gist.Science

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Dit paper introduceert VQA-MHUG, een nieuw dataset met oogvolgingsgegevens van 49 deelnemers, en toont aan dat voor alle onderzochte VQA-modellen een hogere correlatie tussen menselijke en neurale aandacht op tekst een significant voorspeller is van de modelprestaties.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Multimodal Integration of Human-Like Attention in Visual Question Answering

Het paper introduceert MULAN, een nieuwe methode die menselijke aandacht voor zowel afbeeldingen als tekst integreert in een transformer-model voor visuele vraagbeantwoording, waardoor een nieuwe state-of-the-art prestatie wordt bereikt op de VQAv2-dataset met ongeveer 80% minder trainbare parameters dan eerdere werken.

Ekta Sood, Fabian Kögel, Philipp Müller + 3 more2026-03-04💬 cs.CL

Is Attention always needed? A Case Study on Language Identification from Speech

Dit onderzoek presenteert een CRNN-gebaseerd model voor taalherkenning uit spraak dat, getest op dertien Indiase talen en een Europees dataset, prestaties van meer dan 98% bereikt en bovendien robuust is tegen ruis, terwijl het de noodzaak van attention-mechanismen voor deze taak in twijfel trekt.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Deze paper reproduceert en repliceert een seminale studie over adversarial stylometry, waarbij de auteurs concluderen dat de effectiviteit van de onderzochte verdedigingsmechanismen mogelijk wordt overschat door het ontbreken van een controlegroep, en dat automatische round-trip vertaling nieuwe aandacht vereist als een methode die de effectiviteit van auteursidentificatie vermindert.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Statistical Machine Translation for Indic Languages

Dit artikel beschrijft de ontwikkeling en evaluatie van statistische machinevertalingssystemen voor het vertalen tussen het Engels en vijftien Indiase talen, waarbij gebruik wordt gemaakt van de MOSES-toolkit, diverse datasets en standaardmetrieken zoals BLEU, METEOR en RIBES.

Sudhansu Bala Das, Divyajoti Panda, Tapas Kumar Mishra + 1 more2026-03-04💬 cs.CL

Verifying the Robustness of Automatic Credibility Assessment

Dit artikel presenteert BODEGA, een benchmark die aantoont dat moderne taalmodellen kwetsbaarder zijn voor misleidende aanvalstechnieken dan kleinere modellen, waardoor betekenisbehoudende tekstwijzigingen de betrouwbaarheid van automatische geloofwaardigheidsbeoordeling kunnen ondermijnen.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Dit artikel introduceert een voorspellend auteurschapssysteem voor Braziliaans-Portugese AAC-toepassingen dat de BERTimbau-modellen gebruikt om pictogrammen te voorspellen op basis van hun bijschriften, synoniemen of definities, waarbij bijschriften de hoogste nauwkeurigheid bieden.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

Dit paper introduceert FiADD, een nieuw raamwerk dat de detectie van impliciete haattaal verbetert door de oppervlaktevorm dichter bij de onderliggende betekenis te brengen en de afstand tussen labelclusters te vergroten, wat resulteert in significante prestatieverbeteringen bij haatdetectie en verwante taken.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Dit artikel introduceert BodoBERT, het eerste taalmodel voor het Bodo, en een ensemble deep learning-model voor part-of-speech tagging dat een F1-score van 0,8041 bereikt, waarmee een bijdrage wordt geleverd aan de NLP-ondersteuning voor deze laag-resourcetaal.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Deze studie schat dat tussen de 6,5% en 16,9% van de teksten in peer reviews voor AI-conferenties na de lancering van ChatGPT substantieel door grote taalmodellen is gegenereerd of gewijzigd, waarbij een hogere kans op AI-gebruik samenhangt met factoren zoals lagere zelfvertrouwen, deadlines en minder interactie met auteurs.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Dit artikel toont aan dat voor Wait-Only niet-blokkerende broadcast-protocollen de complexiteit van de staat- en configuratie-coverability-problemen daalt van Ackermann-hard naar respectievelijk P-compleet en PSPACE-compleet.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

Topic-Based Watermarks for Large Language Models

Deze paper introduceert een lichtgewicht, onderwerpgeleide watermerktechniek voor grote taalmodellen die door semantisch uitgelijnde tokens te selecteren, robuuste detectie van AI-gegenereerde tekst mogelijk maakt zonder in te leveren op tekstkwaliteit of extra systemen te vereisen.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit

Deze studie analyseert meer dan 100 miljoen Reddit-berichten over de Britse politiek en concludeert dat het gebruik van 'triggerwoorden' leidt tot een significante toename in betrokkenheid, maar ook tot meer woede, negativiteit en polarisatie.

Dimosthenis Antypas, Christian Arnold, Nedjma Ousidhoum + 2 more2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Deze paper introduceert NutriBench, het eerste publiek beschikbare dataset voor het evalueren van grote taalmodellen op hun vermogen om macronutriënten uit maaltijdbeschrijvingen te schatten, en toont aan dat deze modellen snelle, vergelijkbare resultaten kunnen bieden ten opzichte van professionele diëtisten.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Dit paper introduceert MELODI, een raamwerk en bijbehorende dataset voor het monitoren en analyseren van het energieverbruik bij inferentie van grote taalmodellen, waarbij wordt aangetoond dat promptkenmerken een aanzienlijke invloed hebben op de energie-efficiëntie en de noodzaak onderstreept wordt voor duurzamere implementaties.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

Deze paper introduceert BA-LoRA, een nieuwe parameter-efficiënte fine-tuning-methode die door middel van gerichte regularisatie de 'catastrophic inheritance' van vooroordelen en ruis in grote taalmodellen effectief tegengaat en zo de robuustheid en prestaties verbetert.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

OM4OV: Leveraging Ontology Matching for Ontology Versioning

Deze studie analyseert de verschillen tussen ontologie-matching en versiebeheer, introduceert een gestandaardiseerd OM4OV-pipeline en stelt een cross-reference-mechanisme voor om de prestaties van bestaande ontologie-matching-systemen bij versiebeheer te optimaliseren.

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Dit onderzoek toont aan dat meningsverschillen tussen annotatoren vaak voortkomen uit complexe factoren zoals taakonduidelijkheid en antwoordstijl in plaats van simpele ruis, wat de huidige aannames in beloningsmodellering en evaluatie van grote taalmodellen uitdaagt en nieuwe methoden vereist om deze divergentie te identificeren en te mitigeren.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

Dit paper introduceert Waffle, een nieuwe fijne-tuningstrategie die gebruikmaakt van structuurbewuste aandacht en contrastief leren om multimodale modellen te verbeteren voor het automatisch genereren van HTML-code uit UI-ontwerpen, wat resulteert in aanzienlijk betere prestaties op bestaande en nieuwe benchmarks.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

Dit onderzoek toont aan dat ChatGPT communicatiegegevens uit samenwerkende probleemoplossingstaken succesvol kan coderen, hoewel de prestaties variëren afhankelijk van het model, het coderingskader en de taakeigenschappen, en dat promptverfijning op basis van feedback slechts beperkt consistent de nauwkeurigheid verbetert.

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL

← Vorige Volgende →