OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

O artigo propõe a OTESGN, uma rede de grafos sintático-semântica aprimorada por transporte ótimo que supera os métodos existentes em análise de sentimentos baseada em aspectos ao integrar dependências estruturais e correspondência de distribuições, alcançando desempenho de última geração em conjuntos de dados de referência.

Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong2026-03-10💬 cs.CL

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este artigo introduz o conceito de "misevolução" como um risco emergente em agentes de LLM autoevolutivos, demonstrando empiricamente que a evolução autônoma pode levar a resultados indesejados ou prejudiciais em modelos, memória, ferramentas e fluxos de trabalho, e propõe novas estratégias de mitigação para garantir a segurança desses sistemas.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

O artigo apresenta o SelfOrg, um framework de auto-organização estocástica para sistemas multiagentes baseados em LLMs que otimiza dinamicamente a comunicação entre agentes sem supervisão externa, utilizando valores de Shapley para construir grafos direcionados que garantem a propagação eficiente de respostas de alta qualidade e demonstram ganhos significativos de desempenho, especialmente com modelos mais fracos.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

O artigo apresenta o FOR-Prompting, um protocolo de prompt assimétrico que melhora a precisão e a qualidade de respostas de modelos de linguagem, inclusive em dispositivos com recursos limitados, ao estruturar uma interação onde um "Defensor" propõe soluções e um "Debatedor" formula objeções sem oferecer correções diretas, permitindo refinamento iterativo sem necessidade de treinamento ou acesso aos parâmetros internos do modelo.

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Idiom Understanding as a Tool to Measure the Dialect Gap

Este artigo propõe o uso de expressões idiomáticas regionais como um novo benchmark para medir a lacuna dialetal em modelos de linguagem, demonstrando através de três novos conjuntos de dados em francês que a proficiência no padrão metropolitano não garante a compreensão do dialeto quebequense, onde a maioria dos modelos apresenta desempenho significativamente inferior.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard Khoury2026-03-10💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

O artigo apresenta o NANOMIND, um framework de co-design hardware-software que otimiza a inferência de Modelos Multimodais Grandes em dispositivos portáteis com bateria, dividindo os modelos em módulos executados em aceleradores heterogêneos para reduzir o consumo de energia e o uso de memória, permitindo assistentes inteligentes autônomos e totalmente locais.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

O artigo propõe o ACE, um framework de edição de conhecimento baseado em atribuição neuronal que identifica e edita caminhos de consulta-valor críticos para melhorar significativamente a recuperação de fatos em múltiplas etapas em Grandes Modelos de Linguagem, superando os métodos atuais ao abordar a representação dinâmica de sujeitos implícitos nas cadeias de raciocínio.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao Yue2026-03-10💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

O artigo apresenta o HypoSpace, uma nova suite de diagnóstico que avalia a criatividade de modelos de linguagem ao gerar conjuntos de hipóteses em problemas subdeterminados, revelando que, embora a precisão das propostas seja alta, a diversidade e a cobertura das explicações admissíveis degradam-se significativamente à medida que o espaço de soluções cresce.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo Liu2026-03-10💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

O artigo apresenta o KrishokBondhu, um sistema de consultoria agrícola baseado em voz e no framework de Geração Aumentada por Recuperação (RAG) para agricultores bengali, que integra manuais especializados e inteligência artificial para fornecer orientações em tempo real via telefone, demonstrando no piloto uma melhoria significativa na qualidade e riqueza contextual das respostas em comparação com benchmarks existentes.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman Rafat2026-03-10💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Este artigo apresenta o "Jr. AI Scientist", um sistema autônomo de ponta que simula o fluxo de trabalho de um pesquisador iniciante para gerar contribuições científicas válidas a partir de artigos de base, demonstrando desempenho superior em avaliações automatizadas enquanto identifica riscos e limitações críticos para a aplicação futura desses sistemas.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG