VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

Cet article présente VQA-MHUG, un nouveau jeu de données de regards humains sur les images et les questions, et démontre pour la première fois que la corrélation entre l'attention textuelle des modèles de VQA et celle des humains est un prédicteur significatif de leurs performances, soulignant ainsi le besoin d'améliorer les mécanismes d'attention textuelle dans les architectures multimodales.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Reproduction and Replication of an Adversarial Stylometry Experiment

Cette étude de reproduction et de réplication d'une expérience de stylométrie adversaire révèle que, bien que les défenses contre l'attribution d'auteur soient efficaces, leur efficacité pourrait être surestimée dans l'étude originale en raison de l'absence d'un groupe témoin, tout en mettant en évidence le potentiel prometteur de la traduction aller-retour automatique.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Cette étude propose l'utilisation de BERTimbau pour prédire des pictogrammes dans les systèmes de communication alternative et augmentée pour le portugais brésilien, démontrant que la représentation des pictogrammes par leurs légendes, synonymes ou définitions offre des performances comparables, avec une précision optimale obtenue via les légendes.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Cette étude présente une méthode d'estimation de la proportion de textes modifiés par des modèles de langage dans les relectures de conférences d'IA, révélant que 6,5 % à 16,9 % de ces relectures (ICLR 2024, NeurIPS 2023, CoRL 2023, EMNLP 2023) auraient été substantiellement altérées par l'IA, avec une corrélation observée entre l'usage de ces outils et des facteurs tels que la faible confiance, la proximité des délais et la réticence à répondre aux répliques des auteurs.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Cet article démontre que les problèmes de couverture d'état et de configuration, qui sont généralement Ackermann-difficiles pour les protocoles de diffusion non bloquants, deviennent respectivement P-complets et PSPACE-complets lorsque ces protocoles sont de type « Wait-Only », c'est-à-dire qu'aucun processus ne peut à la fois envoyer et recevoir des messages.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

Ce papier présente NutriBench, le premier jeu de données public pour évaluer les grands modèles de langage sur l'estimation nutritionnelle à partir de descriptions de repas, en démontrant leur efficacité et leur rapidité par rapport aux nutritionnistes tout en soulignant les enjeux de sécurité pour les patients diabétiques.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Cette étude remet en question l'hypothèse selon laquelle les désaccords entre annotateurs sont de simples bruits, propose une taxonomie détaillée de leurs causes (comme le manque de spécification de la tâche ou le style de réponse) et démontre l'inefficacité des méthodes actuelles de modélisation de récompense et d'évaluation par LLM face à ces divergences, tout en proposant de nouvelles méthodes pour les identifier et les atténuer.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

L'article présente Waffle, une nouvelle stratégie d'affinement de modèles multimodaux qui améliore la génération de code HTML à partir de designs d'interface utilisateur en utilisant un mécanisme d'attention conscient de la structure et un apprentissage contrastif, surpassant ainsi les méthodes actuelles sur les benchmarks WebSight-Test et Design2Code.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL