cs.CL artigos | Gist.Science

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

O artigo "HatePrototypes" propõe representações vetoriais interpretáveis e transferíveis, derivadas de poucos exemplos por classe, que permitem a detecção eficiente de discurso de ódio explícito e implícito sem a necessidade de repetidos ajustes finos, utilizando uma abordagem de saída antecipada sem parâmetros.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe Cointet2026-03-10💬 cs.CL

Multimodal LLMs Do Not Compose Skills Optimally Across Modalities

O artigo demonstra que os Modelos de Linguagem Grandes Multimodais (MLLMs) atuais apresentam uma lacuna significativa na composição de habilidades entre modalidades, a qual permanece substancial mesmo após a aplicação de técnicas de prompting e ajuste fino.

Paula Ontalvilla, Aitor Ormazabal, Gorka Azkune2026-03-10💬 cs.CL

Stealth Fine-Tuning: Efficiently Breaking Alignment in RVLMs Using Self-Generated CoT

Este artigo apresenta o "Stealth Fine-Tuning", um método de baixo custo que quebra a segurança de Modelos de Linguagem Visão-Raciocínio (RVLMs) ao induzir traços de raciocínio prejudiciais e utilizá-los para ajuste fino, superando significativamente os métodos de ataque existentes enquanto preserva a capacidade geral de raciocínio.

Le Yu, Zhengyue Zhao, Yawen Zheng, Yunhao Liu2026-03-10💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

Este artigo apresenta o Graphectory, uma abordagem centrada em processos para analisar e monitorar em tempo real sistemas de software agênticos, permitindo a identificação e correção de trajetórias ineficientes, o que resulta em taxas de resolução significativamente maiores e trajetórias mais curtas.

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan Jabbarvand2026-03-10💬 cs.CL

SETUP: Sentence-level English-To-Uniform Meaning Representation Parser

Este artigo apresenta o SETUP, um novo parser para representação de significado uniforme (UMR) em inglês que combina métodos de ajuste fino e conversão de dependências universais para alcançar ganhos substanciais na precisão da geração automática de gráficos semânticos.

Emma Markle, Javier Gutierrez Bach, Shira Wein2026-03-10💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

O artigo apresenta o Parallel Decoder Transformer (PDT), uma arquitetura que internaliza a coordenação de geração paralela em modelos de linguagem congelados, utilizando um planejador inicial e um mecanismo de "Dynamic Notes Bus" para sincronizar múltiplos fluxos de decodificação sem depender de orquestração externa.

Logan Robbins2026-03-10💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

O artigo apresenta o CompanionCast, um quadro geral que orquestra múltiplos agentes de IA especializados para simular dinâmicas de grupo autênticas em experiências compartilhadas, demonstrando através de estudos com torcedores de futebol que o sistema melhora significativamente a presença social e o compartilhamento emocional em comparação com o consumo solitário de mídia.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah Hester2026-03-10💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Este artigo apresenta uma pesquisa abrangente sobre a adaptação de agentes de IA pós-treinamento, organizando o campo fragmentado em um framework de quatro paradigmas que engloba a adaptação do agente e das ferramentas, analisando métodos de pós-treinamento, arquiteturas de memória adaptativa e habilidades de agentes, além de discutir suas compensações, práticas de avaliação e desafios futuros.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han2026-03-10💬 cs.CL

A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

Este trabalho apresenta um framework leve e explicável de duas etapas, baseado em Swin Transformer e decodificadores de linguagem, que alcança desempenho quase perfeito na identificação de culturas e doenças e na resposta a perguntas visuais, superando modelos maiores com menos parâmetros e oferecendo evidências interpretáveis.

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam Ansary2026-03-10💬 cs.CL

NC-Bench: An LLM Benchmark for Evaluating Conversational Competence

O NC-Bench é um novo benchmark para avaliar a competência conversacional de modelos de linguagem, focando na estrutura e no formato das interações com base no IBM Natural Conversation Framework, em vez do conteúdo, e revela que, embora os modelos se saiam bem em respostas básicas, enfrentam dificuldades significativas em tarefas de reparo e em solicitações complexas de múltiplas voltas.

Robert J. Moore, Sungeun An, Farhan Ahmed, Jay Pankaj Gala2026-03-10💬 cs.CL

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

Este artigo apresenta a primeira pesquisa que revisa sistematicamente a interação bidirecional entre Grandes Modelos de Linguagem e Algoritmos de Multi-Armed Bandit em nível de componente, destacando como os bandits aprimoram desafios dos LLMs e como os LLMs redefinem componentes centrais dos sistemas de bandit para melhorar a tomada de decisão.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

O artigo apresenta o MAS-Orchestra, um framework de treinamento que formula a orquestração de agentes como um problema de aprendizado por reforço para gerar sistemas multiagentes de forma holística, e o MASBENCH, um benchmark controlado que demonstra que os benefícios dos sistemas multiagentes dependem criticamente da estrutura da tarefa, permitindo melhorias consistentes e eficiência superior em diversas tarefas de raciocínio.

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq Joty2026-03-10💬 cs.CL

Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents

Este artigo apresenta o DFAH, uma estrutura de garantia que mede independentemente a determinismo e a precisão de agentes de IA em serviços financeiros, revelando que os dois atributos não são correlacionados e que nenhum modelo atual alcança simultaneamente determinismo perfeito e alta precisão, embora arquiteturas baseadas em esquema possam atender aos requisitos de auditoria.

Raffi Khatchadourian2026-03-10💬 cs.CL

EFT-CoT: A Multi-Agent Chain-of-Thought Framework for Emotion-Focused Therapy

O artigo propõe o EFT-CoT, um framework multiagente baseado em Terapia Focada nas Emoções (EFT) que, juntamente com o dataset EFT-Instruct e o modelo EFT-LLM, supera abordagens tradicionais de Terapia Cognitivo-Comportamental ao oferecer suporte de saúde mental com maior profundidade empática e profissionalismo estrutural.

Lanqing Du, Yunong Li, YuJie Long, Shihong Chen2026-03-10💬 cs.CL

Improving X-Codec-2.0 for Multi-Lingual Speech: 25 Hz Latent Rate and 24 kHz Sampling

Este trabalho aprimora o modelo X-Codec-2.0 para processamento de fala multilíngue ao reduzir a taxa latente para 25 Hz e aumentar a taxa de amostragem para 24 kHz, resultando em maior eficiência e qualidade perceptiva superior sem alterar a arquitetura central.

Husein Zolkepli2026-03-10💬 cs.CL

RedSage: A Cybersecurity Generalist LLM

O artigo apresenta o RedSage, um assistente de cibersegurança de código aberto e localmente implantável, treinado com dados de domínio especializado e aumentação agênica, que supera modelos de base em benchmarks de cibersegurança e tarefas gerais de raciocínio.

Naufal Suryanto, Muzammal Naseer, Pengfei Li, Syed Talal Wasim, Jinhui Yi, Juergen Gall, Paolo Ceravolo, Ernesto Damiani2026-03-10💬 cs.CL

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

O artigo apresenta o Mem-T, um agente de memória autônomo que utiliza o framework de aprendizado por reforço MoT-GRPO para transformar recompensas esparsas em supervisão densa, permitindo a otimização conjunta de construção e recuperação de memória e alcançando desempenho superior e maior eficiência em comparação com métodos existentes.

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

Este estudo demonstra que, para a detecção de valores humanos em nível de frase, a estrutura de valores de ordem superior de Schwartz funciona melhor como um viés indutivo do que como uma regra de roteamento rígida, sendo que os ganhos mais significativos de desempenho provêm de técnicas de calibração e ensembles em vez de arquiteturas hierárquicas complexas.

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

O artigo apresenta o LatentMem, um framework de memória multiagente aprendível que supera as limitações de homogeneização e sobrecarga de informação existentes ao sintetizar memórias latentes compactas e específicas para cada agente, otimizando-as através da Política de Otimização de Memória Latente (LMPO) para alcançar ganhos de desempenho significativos sem modificar os sistemas subjacentes.

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

← Anterior Próximo →