cs.CL articles | Gist.Science

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Cet article présente VQA-MHUG, un nouveau jeu de données de regards humains sur les images et les questions, et démontre pour la première fois que la corrélation entre l'attention textuelle des modèles de VQA et celle des humains est un prédicteur significatif de leurs performances, soulignant ainsi le besoin d'améliorer les mécanismes d'attention textuelle dans les architectures multimodales.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Multimodal Integration of Human-Like Attention in Visual Question Answering

Ce papier présente MULAN, une méthode novatrice qui intègre l'attention humaine multimodale (image et texte) dans un modèle de réponse aux questions visuelles (VQA) basé sur les transformers, permettant d'atteindre des performances de pointe sur le jeu de données VQAv2 avec environ 80 % de paramètres en moins que les travaux antérieurs.

Ekta Sood, Fabian Kögel, Philipp Müller + 3 more2026-03-04💬 cs.CL

Is Attention always needed? A Case Study on Language Identification from Speech

Cette étude propose un modèle de CRNN pour l'identification de la langue à partir de la parole, démontrant une précision supérieure à 98 % sur treize langues indiennes et une forte robustesse au bruit, tout en questionnant la nécessité systématique des mécanismes d'attention par rapport aux architectures existantes.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Cette étude de reproduction et de réplication d'une expérience de stylométrie adversaire révèle que, bien que les défenses contre l'attribution d'auteur soient efficaces, leur efficacité pourrait être surestimée dans l'étude originale en raison de l'absence d'un groupe témoin, tout en mettant en évidence le potentiel prometteur de la traduction aller-retour automatique.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Statistical Machine Translation for Indic Languages

Ce papier présente le développement et l'évaluation d'un système de traduction automatique statistique (SMT) utilisant l'outil MOSES pour traduire l'anglais vers et depuis quinze langues indiennes à ressources limitées, en exploitant les jeux de données Samanantar et OPUS et en évaluant la qualité via les métriques BLEU, METEOR et RIBES.

Sudhansu Bala Das, Divyajoti Panda, Tapas Kumar Mishra + 1 more2026-03-04💬 cs.CL

Verifying the Robustness of Automatic Credibility Assessment

Cette étude évalue la vulnérabilité des classificateurs de texte, en particulier des grands modèles de langage, face aux attaques par exemples adversariaux dans le cadre de la détection de désinformation, et introduit le benchmark BODEGA pour simuler des scénarios réels de modération de contenu.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Cette étude propose l'utilisation de BERTimbau pour prédire des pictogrammes dans les systèmes de communication alternative et augmentée pour le portugais brésilien, démontrant que la représentation des pictogrammes par leurs légendes, synonymes ou définitions offre des performances comparables, avec une précision optimale obtenue via les légendes.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

Ce papier présente FiADD, un cadre novateur qui améliore la détection des discours de haine implicite en rapprochant la forme de surface de son sens sous-jacent tout en augmentant la séparation entre les clusters de labels, démontrant ainsi des performances supérieures sur plusieurs tâches de classification.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Cette étude présente le développement de BodoBERT, le premier modèle de langage pour le bodo, et d'un taggeur de parties du discours basé sur l'apprentissage profond qui atteint un score F1 de 0,8041, comblant ainsi un vide majeur dans le traitement automatique des langues pour les langues à ressources limitées de la région.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Cette étude présente une méthode d'estimation de la proportion de textes modifiés par des modèles de langage dans les relectures de conférences d'IA, révélant que 6,5 % à 16,9 % de ces relectures (ICLR 2024, NeurIPS 2023, CoRL 2023, EMNLP 2023) auraient été substantiellement altérées par l'IA, avec une corrélation observée entre l'usage de ces outils et des facteurs tels que la faible confiance, la proximité des délais et la réticence à répondre aux répliques des auteurs.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Cet article démontre que les problèmes de couverture d'état et de configuration, qui sont généralement Ackermann-difficiles pour les protocoles de diffusion non bloquants, deviennent respectivement P-complets et PSPACE-complets lorsque ces protocoles sont de type « Wait-Only », c'est-à-dire qu'aucun processus ne peut à la fois envoyer et recevoir des messages.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

Topic-Based Watermarks for Large Language Models

Cet article propose un schéma de filigrane léger et guidé par le sujet pour les grands modèles de langage, qui partitionne le vocabulaire en sous-ensembles sémantiques pour intégrer des marques robustes tout en préservant la qualité du texte et en évitant des intégrations complexes.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit

En analysant plus de 100 millions de commentaires Reddit sur la politique britannique, cette étude démontre que l'utilisation de mots déclencheurs spécifiques amplifie l'engagement et l'animosité, contribuant ainsi à la polarisation des débats en ligne.

Dimosthenis Antypas, Christian Arnold, Nedjma Ousidhoum + 2 more2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Ce papier présente NutriBench, le premier jeu de données public pour évaluer les grands modèles de langage sur l'estimation nutritionnelle à partir de descriptions de repas, en démontrant leur efficacité et leur rapidité par rapport aux nutritionnistes tout en soulignant les enjeux de sécurité pour les patients diabétiques.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Cet article présente MELODI, un cadre et un jeu de données novateurs conçus pour surveiller et analyser la consommation énergétique des inférences de modèles de langage, révélant ainsi l'impact significatif des attributs des invites sur l'efficacité énergétique et ouvrant la voie à des déploiements plus durables.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

Cet article présente BA-LoRA, une méthode d'adaptation à faible rang qui atténue l'héritage catastrophique des biais dans les grands modèles de langage en intégrant des régularisateurs de cohérence, de diversité et de décomposition SVD pour améliorer la robustesse et l'équité.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

OM4OV: Leveraging Ontology Matching for Ontology Versioning

Cette étude propose et évalue le pipeline OM4OV, qui formalise la réutilisation des systèmes d'appariement d'ontologies pour la gestion de versions tout en introduisant un mécanisme d'optimisation par « cross-reference » pour corriger les biais de performance et améliorer la détection des entités mises à jour.

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Cette étude remet en question l'hypothèse selon laquelle les désaccords entre annotateurs sont de simples bruits, propose une taxonomie détaillée de leurs causes (comme le manque de spécification de la tâche ou le style de réponse) et démontre l'inefficacité des méthodes actuelles de modélisation de récompense et d'évaluation par LLM face à ces divergences, tout en proposant de nouvelles méthodes pour les identifier et les atténuer.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

L'article présente Waffle, une nouvelle stratégie d'affinement de modèles multimodaux qui améliore la génération de code HTML à partir de designs d'interface utilisateur en utilisant un mécanisme d'attention conscient de la structure et un apprentissage contrastif, surpassant ainsi les méthodes actuelles sur les benchmarks WebSight-Test et Design2Code.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

Cette étude démontre que ChatGPT peut coder efficacement les données de communication pour l'évaluation de la résolution collaborative de problèmes, bien que sa performance varie selon les modèles, les cadres d'analyse et les tâches, offrant ainsi des pistes pour des méthodes d'analyse évolutives.

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL

← Précédent Suivant →