HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

O artigo "HatePrototypes" propõe representações vetoriais interpretáveis e transferíveis, derivadas de poucos exemplos por classe, que permitem a detecção eficiente de discurso de ódio explícito e implícito sem a necessidade de repetidos ajustes finos, utilizando uma abordagem de saída antecipada sem parâmetros.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe Cointet2026-03-10💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

O artigo apresenta o CompanionCast, um quadro geral que orquestra múltiplos agentes de IA especializados para simular dinâmicas de grupo autênticas em experiências compartilhadas, demonstrando através de estudos com torcedores de futebol que o sistema melhora significativamente a presença social e o compartilhamento emocional em comparação com o consumo solitário de mídia.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah Hester2026-03-10💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Este artigo apresenta uma pesquisa abrangente sobre a adaptação de agentes de IA pós-treinamento, organizando o campo fragmentado em um framework de quatro paradigmas que engloba a adaptação do agente e das ferramentas, analisando métodos de pós-treinamento, arquiteturas de memória adaptativa e habilidades de agentes, além de discutir suas compensações, práticas de avaliação e desafios futuros.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han2026-03-10💬 cs.CL

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

Este trabalho apresenta um framework leve e explicável de duas etapas, baseado em Swin Transformer e decodificadores de linguagem, que alcança desempenho quase perfeito na identificação de culturas e doenças e na resposta a perguntas visuais, superando modelos maiores com menos parâmetros e oferecendo evidências interpretáveis.

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam Ansary2026-03-10💬 cs.CL

NC-Bench: An LLM Benchmark for Evaluating Conversational Competence

O NC-Bench é um novo benchmark para avaliar a competência conversacional de modelos de linguagem, focando na estrutura e no formato das interações com base no IBM Natural Conversation Framework, em vez do conteúdo, e revela que, embora os modelos se saiam bem em respostas básicas, enfrentam dificuldades significativas em tarefas de reparo e em solicitações complexas de múltiplas voltas.

Robert J. Moore, Sungeun An, Farhan Ahmed, Jay Pankaj Gala2026-03-10💬 cs.CL

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

O artigo apresenta o MAS-Orchestra, um framework de treinamento que formula a orquestração de agentes como um problema de aprendizado por reforço para gerar sistemas multiagentes de forma holística, e o MASBENCH, um benchmark controlado que demonstra que os benefícios dos sistemas multiagentes dependem criticamente da estrutura da tarefa, permitindo melhorias consistentes e eficiência superior em diversas tarefas de raciocínio.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents

Este artigo apresenta o DFAH, uma estrutura de garantia que mede independentemente a determinismo e a precisão de agentes de IA em serviços financeiros, revelando que os dois atributos não são correlacionados e que nenhum modelo atual alcança simultaneamente determinismo perfeito e alta precisão, embora arquiteturas baseadas em esquema possam atender aos requisitos de auditoria.

Raffi Khatchadourian2026-03-10💬 cs.CL

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Este estudo demonstra que, para a detecção de valores humanos em nível de frase, a estrutura de valores de ordem superior de Schwartz funciona melhor como um viés indutivo do que como uma regra de roteamento rígida, sendo que os ganhos mais significativos de desempenho provêm de técnicas de calibração e ensembles em vez de arquiteturas hierárquicas complexas.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

O artigo apresenta o LatentMem, um framework de memória multiagente aprendível que supera as limitações de homogeneização e sobrecarga de informação existentes ao sintetizar memórias latentes compactas e específicas para cada agente, otimizando-as através da Política de Otimização de Memória Latente (LMPO) para alcançar ganhos de desempenho significativos sem modificar os sistemas subjacentes.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG