cs.CL Arbeiten | Gist.Science

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Die Studie stellt den VQA-MHUG-Datensatz mit multimodalen Blickdaten von 49 Teilnehmern vor und zeigt erstmals, dass eine höhere Übereinstimmung der Aufmerksamkeitsmechanismen von VQA-Modellen mit der menschlichen Textaufmerksamkeit ein signifikanter Prädiktor für die Modellleistung ist.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Multimodal Integration of Human-Like Attention in Visual Question Answering

Die Arbeit stellt MULAN vor, das erste Modell zur multimodalen Integration menschlicher Aufmerksamkeitsmuster in neuronale Netzwerke für das Visual Question Answering, das durch die Kombination von Bild- und Text-Salienzmodellen mit einem Transformer-basierten Ansatz sowohl einen neuen State-of-the-Art auf dem VQAv2-Datensatz erreicht als auch die Anzahl der trainierbaren Parameter im Vergleich zu früheren Arbeiten um etwa 80 % reduziert.

Ekta Sood, Fabian Kögel, Philipp Müller + 3 more2026-03-04💬 cs.CL

Is Attention always needed? A Case Study on Language Identification from Speech

Diese Studie stellt ein auf CRNN basierendes Sprachidentifikationssystem vor, das auf MFCC-Features trainiert wurde und bei der Klassifizierung von 13 indischen Sprachen sowie unter Rauschbedingungen eine hohe Genauigkeit und Robustheit aufweist, wobei die Notwendigkeit von Aufmerksamkeitsmechanismen hinterfragt wird.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Diese Studie reproduziert und repliziert ein bahnbrechendes Experiment zur adversarialen Stylometrie, bestätigt zwar die ursprüngliche Schlussfolgerung, stellt jedoch aufgrund fehlender Kontrollgruppen die Wirksamkeit der untersuchten Verteidigungsmethoden in Frage und hebt insbesondere das Potenzial der automatischen Rundreise-Übersetzung als wirksames Mittel zur Umgehung von Autorenidentifizierung hervor.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Statistical Machine Translation for Indic Languages

Diese Arbeit stellt die Entwicklung statistischer maschineller Übersetzungssysteme für den bidirektionalen Transfer zwischen Englisch und fünfzehn indischen Sprachen vor, wobei die MOSES-Toolkit, verschiedene Datensätze und Vorverarbeitungsmethoden zur Optimierung der Übersetzungsqualität eingesetzt werden.

Sudhansu Bala Das, Divyajoti Panda, Tapas Kumar Mishra + 1 more2026-03-04💬 cs.CL

Verifying the Robustness of Automatic Credibility Assessment

Diese Studie untersucht die Anfälligkeit von Textklassifikatoren für Adversarial Attacks im Kontext der Glaubwürdigkeitsbewertung, stellt mit BODEGA ein neues Benchmark-Framework vor und zeigt, dass moderne Large Language Models anfälliger für solche Manipulationen sind als ältere Modelle.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Diese Studie stellt einen Ansatz zur Vorhersage von Piktogrammen für brasilianische portugiesische AAC-Systeme vor, bei dem das Modell BERTimbau mit einem speziell erstellten Korpus trainiert wird und zeigt, dass die Verwendung von Bildunterschriften die höchste Genauigkeit erzielt, während Synonyme zu einer geringeren Perplexität führen.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

Die Studie stellt FiADD vor, ein neuartiges Framework, das durch die Kombination von inferenzbasiertem Kontext und dichte-basierter Diskriminierung die Feinabstimmung von vortrainierten Sprachmodellen verbessert, um subtile implizite Hassrede sowie verwandte Phänomene wie Sarkasmus und Ironie präziser zu erkennen.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Diese Studie stellt BodoBERT, das erste Sprachmodell für die Bodo-Sprache, vor und entwickelt ein darauf aufbauendes Ensemble-Deep-Learning-Modell zur Part-of-Speech-Tagging, das eine F1-Bewertung von 0,8041 erreicht.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Die Studie schätzt mittels eines Maximum-Likelihood-Modells, dass zwischen 6,5 % und 16,9 % der Textmenge in den Peer-Reviews ausgewählter KI-Konferenzen nach dem Erscheinen von ChatGPT maßgeblich von großen Sprachmodellen beeinflusst oder generiert wurde, wobei die Nutzung insbesondere bei geringerer Vertrauenswürdigkeit, kurz vor Fristen und bei weniger engagierten Gutachtern häufiger auftritt.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Die Arbeit zeigt, dass sich die Komplexität der Zustands- und Konfigurationsabdeckbarkeitsprobleme bei nicht-blockierenden Broadcast-Protokollen von Ackermann-schwer auf P-vollständig bzw. PSPACE-vollständig reduziert, sobald die Protokolle die Wait-Only-Eigenschaft (kein gleichzeitiges Senden und Empfangen) erfüllen.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

Topic-Based Watermarks for Large Language Models

Die vorgestellte Arbeit entwickelt ein leichtgewichtiges, themenbasiertes Wasserzeichen-Verfahren für Large Language Models, das durch die semantische Auswahl von Token-Subsets eine hohe Robustheit gegen Angriffe bei gleichzeitiger Wahrung der Textqualität und minimaler Integrationsoverhead gewährleistet.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit

Diese Studie analysiert über 100 Millionen Reddit-Kommentare zur britischen Politik und zeigt, dass das Vorkommen bestimmter „Trigger-Wörter" zu höherer Beteiligung sowie zu einer Zunahme an Feindseligkeit, Wut und Hass führt.

Dimosthenis Antypas, Christian Arnold, Nedjma Ousidhoum + 2 more2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Die Studie stellt NutriBench vor, den ersten öffentlich zugänglichen Benchmark zur Bewertung von Large Language Models bei der Schätzung von Nährwerten aus Mahlzeitenbeschreibungen, und zeigt deren Potenzial auf, professionelle Ernährungsexperten durch schnelle und vergleichbar genaue Vorhersagen zu unterstützen.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Diese Arbeit stellt MELODI vor, ein Framework zur Überwachung des Energieverbrauchs bei der Inferenz von Large Language Models, das durch die Erstellung eines umfassenden Datensatzes zeigt, wie Prompt-Eigenschaften die Energieeffizienz beeinflussen und somit Optimierungsansätze für nachhaltigere KI-Systeme aufzeigt.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

Die Arbeit stellt BA-LoRA vor, eine bias-mindernde Low-Rank-Adaptierungsmethode, die durch gezielte Regularisierungen das Problem der katastrophalen Vererbung von Voreingenommenheit und Rauschen in großen Sprachmodellen effektiv bekämpft und dabei sowohl die Leistung als auch die Robustheit im Vergleich zu bestehenden Ansätzen verbessert.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

OM4OV: Leveraging Ontology Matching for Ontology Versioning

Die Studie analysiert die Unterschiede zwischen Ontologie-Matching und Ontologie-Versionierung, stellt einen formalisierten OM4OV-Prozess vor und schlägt einen Cross-Reference-Mechanismus vor, um die Leistung von Ontologie-Versionierungssystemen zu optimieren.

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Diese Arbeit widerlegt die Annahme, dass Meinungsverschiedenheiten bei Annotatoren lediglich auf Rauschen zurückzuführen sind, indem sie eine Taxonomie von Diskrepanzursachen entwickelt und zeigt, wie sich dies negativ auf das Reward Modeling und die Evaluation von LLMs auswirkt, woraufhin neue Methoden zur Identifizierung und Minderung dieser divergierenden Präferenzen vorgestellt werden.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

Das Paper stellt Waffle vor, eine neue Feinabstimmungsmethode für multimodale Modelle, die durch eine strukturaware Aufmerksamkeitsmechanik und kontrastives Lernen die Umwandlung von UI-Designs in funktionale HTML-Codes verbessert und dabei bestehende Benchmarks signifikant übertrifft.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

Die Studie zeigt, dass ChatGPT zur automatisierten Kodierung von Kommunikationsdaten in kollaborativen Problemlösungsaufgaben eingesetzt werden kann, wobei die Genauigkeit jedoch von der Modellversion, dem verwendeten Kodierungsrahmen und der Aufgabenart abhängt und nicht zwangsläufig durch neuere, auf Schlussfolgerungen spezialisierte Modelle verbessert wird.

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL

← Zurück Weiter →