Trust Me, I Can Convince You: The Contextualized Argument Appraisal Framework

Este artigo propõe o Contextualized Argument Appraisal Framework, um novo modelo que integra variáveis de avaliação cognitiva e características do remetente e receptor para analisar a persuasividade de argumentos, validado através do corpus ContArgA de 4000 anotações que demonstram a correlação entre emoções, familiaridade e a percepção de convencimento.

Lynn Greschner, Sabine Weber, Roman Klinger2026-03-05💬 cs.CL

The Geometry of Reasoning: Flowing Logics in Representation Space

Este trabalho propõe um novo quadro geométrico que modela o raciocínio de grandes modelos de linguagem como fluxos suaves no espaço de representações, demonstrando que o treinamento por previsão de próximo token permite a internalização de invariantes lógicos como geometria de ordem superior e desafia a visão de que esses modelos são meros "papagaios estocásticos".

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

O artigo apresenta o framework REVISION, que integra mineração de intenções implícitas offline e raciocínio online via modelos de linguagem para otimizar sistemas de busca visual no e-commerce, reduzindo significativamente a taxa de cliques nulos ao alinhar as respostas do sistema às necessidades diversificadas dos usuários.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

Este artigo apresenta o MuSaG, o primeiro conjunto de dados multimodal em alemão para detecção de sarcasmo, composto por trechos de programas de televisão com anotações humanas alinhadas de texto, áudio e vídeo, e demonstra que, embora os modelos atuais performem melhor com texto, existe uma lacuna significativa em relação à dependência humana de pistas auditivas, motivando o desenvolvimento de modelos mais robustos para cenários realistas.

Aaron Scott, Maike Züfle, Jan Niehues2026-03-05🤖 cs.AI

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Este trabalho apresenta o Protocolo de Dados de Agentes (ADP), uma linguagem de representação leve que unifica diversos conjuntos de dados de agentes em um formato padronizado, permitindo o ajuste fino eficaz de modelos de linguagem e alcançando desempenho de ponta em tarefas como codificação, navegação e uso de ferramentas sem necessidade de ajuste específico por domínio.

Yueqi Song, Ketan Ramaneti, Zaid Sheikh + 18 more2026-03-05🤖 cs.AI

Multimodal Large Language Models for Low-Resource Languages: A Case Study for Basque

Este artigo apresenta o desenvolvimento de um Modelo de Linguagem Multimodal (MLLM) robusto para a língua basca, demonstrando que uma pequena proporção de dados multimodais em basco (cerca de 20%) é suficiente para obter bons resultados e que não é necessário utilizar um modelo de linguagem base pré-adaptado ao basco para alcançar esse desempenho.

Lukas Arana, Julen Etxaniz, Ander Salaberria + 1 more2026-03-05🤖 cs.AI

Dripper: Token-Efficient Main HTML Extraction with a Lightweight LM

O artigo apresenta o Dripper, um framework leve baseado em Small Language Models (SLMs) que reformula a extração de conteúdo principal de páginas web como uma tarefa de rotulagem de sequência, alcançando um equilíbrio superior entre eficiência e precisão ao superar métodos heurísticos e rivalizar com grandes modelos generativos, enquanto fornece um novo benchmark e um corpus pré-treinado de alta qualidade.

Mengjie Liu, Jiahui Peng, Wenchang Ning + 14 more2026-03-05💬 cs.CL