cs.CL artigos | Gist.Science

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

O artigo apresenta o VQA-MHUG, um novo conjunto de dados de olhar humano multimodal para VQA, e demonstra pela primeira vez que a correlação entre a atenção neural e a humana no texto é um preditor significativo do desempenho do modelo, sugerindo a necessidade de aprimorar os mecanismos de atenção textual nas arquiteturas de visão e linguagem.

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Multimodal Integration of Human-Like Attention in Visual Question Answering

O artigo apresenta o MULAN, a primeira rede que integra atenção humana multimodal (de imagem e texto) em modelos de VQA baseados em transformers, alcançando desempenho state-of-the-art no conjunto de dados VQAv2 com aproximadamente 80% menos parâmetros treináveis que trabalhos anteriores.

Ekta Sood, Fabian Kögel, Philipp Müller + 3 more2026-03-04💬 cs.CL

Is Attention always needed? A Case Study on Language Identification from Speech

Este estudo propõe um modelo de identificação de linguagem baseado em CRNN que, utilizando coeficientes MFCC, alcança alta precisão (superior a 98%) em treze línguas indianas e demonstra robustez ao ruído, questionando a necessidade de mecanismos de atenção em comparação com abordagens state-of-the-art.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Este artigo reproduz e replica um estudo seminal sobre estilometria adversária, concluindo que, embora as defesas analisadas sejam eficazes, sua efetividade pode ter sido superestimada na pesquisa original devido à falta de um grupo de controle, ao mesmo tempo em que destaca a necessidade de reavaliar o método de tradução de ida e volta como uma técnica automática promissora para reduzir a precisão da atribuição de autoria.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Statistical Machine Translation for Indic Languages

Este artigo apresenta o desenvolvimento e a avaliação de modelos de Tradução Automática Estatística (SMT) para traduzir entre o inglês e quinze línguas indianas de recursos limitados, utilizando o toolkit MOSES, conjuntos de dados como Samanantar e OPUS, e métricas padrão como BLEU, METEOR e RIBES.

Sudhansu Bala Das, Divyajoti Panda, Tapas Kumar Mishra + 1 more2026-03-04💬 cs.CL

Verifying the Robustness of Automatic Credibility Assessment

Este artigo avalia a robustez de classificadores de texto contra ataques adversariais que preservam o significado, introduzindo o benchmark BODEGA para quatro tarefas de detecção de desinformação e demonstrando que modelos de linguagem modernos, como o GEMMA, são mais vulneráveis a essas manipulações do que soluções anteriores.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Este artigo propõe o uso do modelo BERTimbau, finetunado em um corpus específico de AAC em português brasileiro, para prever pictogramas em sistemas de comunicação alternativa, demonstrando que representá-los por meio de legendas resulta na maior acurácia, embora sinônimos ofereçam menor perplexidade.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

O artigo apresenta o FiADD, um novo framework que aprimora a detecção de discurso de ódio implícito ao alinhar formas superficiais e significados implícitos enquanto aumenta a separação entre clusters de rótulos, demonstrando ganhos significativos de desempenho em múltiplos conjuntos de dados e tarefas relacionadas.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Este artigo apresenta o desenvolvimento do BodoBERT, o primeiro modelo de linguagem para a língua Bodo, e um modelo de ensemble baseado em aprendizado profundo para o reconhecimento de classes gramaticais (POS) que alcança um F1-score de 0,8041, preenchendo uma lacuna significativa no processamento de linguagem natural para línguas de recursos limitados.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Este estudo apresenta um modelo de máxima verossimilhança para estimar que entre 6,5% e 16,9% do texto em revisões de conferências de IA (como ICLR 2024 e NeurIPS 2023) foi substancialmente modificado ou gerado por LLMs, revelando uma correlação entre o uso dessas ferramentas e fatores como baixa confiança do revisor, submissão próxima ao prazo e menor disposição para responder a réplicas dos autores.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Safety Verification of Wait-Only Non-Blocking Broadcast Protocols

Este artigo demonstra que, para protocolos de transmissão não bloqueantes do tipo "apenas espera" (Wait-Only), os problemas de cobertura de estado e de configuração, que são geralmente Ackermann-difíceis, tornam-se respectivamente P-completo e PSPACE-completo.

Lucie Guillou, Arnaud Sangnier, Nathalie Sznajder2026-03-04💬 cs.CL

Topic-Based Watermarks for Large Language Models

O artigo propõe um esquema de marcação d'água leve e guiado por tópicos para Grandes Modelos de Linguagem que, ao particionar o vocabulário em subconjuntos alinhados semanticamente, consegue embutir marcas robustas contra ataques de parafraseio e perturbação lexical enquanto preserva a qualidade do texto e elimina a necessidade de frameworks especializados.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Causal Effects of Trigger Words in Social Media Discussions: A Large-Scale Case Study about UK Politics on Reddit

Este estudo analisa mais de 100 milhões de comentários no Reddit sobre política britânica e conclui que o uso de "palavras-gatilho" — termos que desafiam a percepção do que é justo ou normal — está associado a um aumento significativo no engajamento e na polarização, gerando respostas mais negativas, furiosas e hostis.

Dimosthenis Antypas, Christian Arnold, Nedjma Ousidhoum + 2 more2026-03-04💬 cs.CL

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

O artigo apresenta o NutriBench, o primeiro conjunto de dados público com descrições de refeições verificadas por humanos para avaliar a capacidade de Grandes Modelos de Linguagem (LLMs) na estimativa nutricional, demonstrando que, embora ofereçam previsões comparáveis às de nutricionistas profissionais, eles são significativamente mais rápidos e possuem potencial para melhorar os resultados de saúde, apesar dos desafios existentes.

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Este artigo apresenta o MELODI, um framework e conjunto de dados inovadores para monitorar e analisar o consumo energético na inferência de modelos de linguagem grandes, revelando disparidades significativas na eficiência energética em relação aos atributos dos prompts e destacando a necessidade de otimização para um futuro sustentável.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

O artigo apresenta o BA-LoRA, um método de adaptação de baixo rank que mitiga a "Herança Catastrófica" em modelos de linguagem grandes ao decompor o problema em três desafios e aplicar regularizadores específicos para preservar o conhecimento, enriquecer as representações e reduzir o viés, superando as variantes atuais de LoRA em desempenho e robustez.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

OM4OV: Leveraging Ontology Matching for Ontology Versioning

Este artigo apresenta o OM4OV, um pipeline formalizado que adapta sistemas de correspondência de ontologias para a versão de ontologias, introduzindo um mecanismo de referência cruzada para otimizar o desempenho na detecção de atualizações e corrigir limitações como medições distorcidas e explicações insuficientes de correspondências falsas.

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Diverging Preferences: When do Annotators Disagree and do Models Know?

Este artigo propõe uma taxonomia para as fontes de divergência nas preferências humanas, demonstrando que elas vão além do ruído simples e afetam negativamente o treinamento e a avaliação de modelos de linguagem, ao mesmo tempo em que desenvolve métodos para identificar e mitigar essas divergências.

Michael JQ Zhang, Zhilin Wang, Jena D. Hwang + 6 more2026-03-04💬 cs.CL

WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development

O artigo apresenta o Waffle, uma nova estratégia de ajuste fino que utiliza mecanismos de atenção sensíveis à estrutura e aprendizado contrastivo para aprimorar a capacidade dos modelos de linguagem de converter designs de interface em código HTML, superando os métodos atuais em métricas de precisão e similaridade visual.

Shanchao Liang, Nan Jiang, Shangshu Qian + 1 more2026-03-04💬 cs.CL

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

Este estudo demonstra que o ChatGPT pode automatizar a codificação de dados de comunicação em tarefas de resolução colaborativa de problemas com um nível satisfatório, embora seu desempenho varie conforme o modelo, o framework de codificação e as características da tarefa, oferecendo assim orientações práticas para a avaliação escalável de habilidades do século XXI.

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL

← Anterior Próximo →