Stochastic Self-Organization in Multi-Agent Systems

O artigo apresenta o SelfOrg, um framework de auto-organização estocástica para sistemas multiagentes baseados em LLMs que otimiza dinamicamente a comunicação entre agentes sem supervisão externa, utilizando valores de Shapley para construir grafos direcionados que garantem a propagação eficiente de respostas de alta qualidade e demonstram ganhos significativos de desempenho, especialmente com modelos mais fracos.

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

O artigo apresenta o FOR-Prompting, um protocolo de prompt assimétrico que melhora a precisão e a qualidade de respostas de modelos de linguagem, inclusive em dispositivos com recursos limitados, ao estruturar uma interação onde um "Defensor" propõe soluções e um "Debatedor" formula objeções sem oferecer correções diretas, permitindo refinamento iterativo sem necessidade de treinamento ou acesso aos parâmetros internos do modelo.

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

Idiom Understanding as a Tool to Measure the Dialect Gap

Este artigo propõe o uso de expressões idiomáticas regionais como um novo benchmark para medir a lacuna dialetal em modelos de linguagem, demonstrando através de três novos conjuntos de dados em francês que a proficiência no padrão metropolitano não garante a compreensão do dialeto quebequense, onde a maioria dos modelos apresenta desempenho significativamente inferior.

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

O artigo apresenta o NANOMIND, um framework de co-design hardware-software que otimiza a inferência de Modelos Multimodais Grandes em dispositivos portáteis com bateria, dividindo os modelos em módulos executados em aceleradores heterogêneos para reduzir o consumo de energia e o uso de memória, permitindo assistentes inteligentes autônomos e totalmente locais.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

O artigo propõe o ACE, um framework de edição de conhecimento baseado em atribuição neuronal que identifica e edita caminhos de consulta-valor críticos para melhorar significativamente a recuperação de fatos em múltiplas etapas em Grandes Modelos de Linguagem, superando os métodos atuais ao abordar a representação dinâmica de sujeitos implícitos nas cadeias de raciocínio.

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

O artigo apresenta o HypoSpace, uma nova suite de diagnóstico que avalia a criatividade de modelos de linguagem ao gerar conjuntos de hipóteses em problemas subdeterminados, revelando que, embora a precisão das propostas seja alta, a diversidade e a cobertura das explicações admissíveis degradam-se significativamente à medida que o espaço de soluções cresce.

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

O artigo apresenta o KrishokBondhu, um sistema de consultoria agrícola baseado em voz e no framework de Geração Aumentada por Recuperação (RAG) para agricultores bengali, que integra manuais especializados e inteligência artificial para fornecer orientações em tempo real via telefone, demonstrando no piloto uma melhoria significativa na qualidade e riqueza contextual das respostas em comparação com benchmarks existentes.

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Este artigo apresenta o "Jr. AI Scientist", um sistema autônomo de ponta que simula o fluxo de trabalho de um pesquisador iniciante para gerar contribuições científicas válidas a partir de artigos de base, demonstrando desempenho superior em avaliações automatizadas enquanto identifica riscos e limitações críticos para a aplicação futura desses sistemas.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

O artigo "HatePrototypes" propõe representações vetoriais interpretáveis e transferíveis, derivadas de poucos exemplos por classe, que permitem a detecção eficiente de discurso de ódio explícito e implícito sem a necessidade de repetidos ajustes finos, utilizando uma abordagem de saída antecipada sem parâmetros.

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

O artigo apresenta o SPOT, o primeiro corpus anotado em francês e benchmark para detectar "pontos de parada" (intervenções críticas sutis) em conversas online, demonstrando que modelos codificadores supervisionados superam grandes modelos de linguagem em tarefas de classificação de comentários em redes sociais.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

O artigo apresenta o CompanionCast, um quadro geral que orquestra múltiplos agentes de IA especializados para simular dinâmicas de grupo autênticas em experiências compartilhadas, demonstrando através de estudos com torcedores de futebol que o sistema melhora significativamente a presença social e o compartilhamento emocional em comparação com o consumo solitário de mídia.

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

Este artigo apresenta uma pesquisa abrangente sobre a adaptação de agentes de IA pós-treinamento, organizando o campo fragmentado em um framework de quatro paradigmas que engloba a adaptação do agente e das ferramentas, analisando métodos de pós-treinamento, arquiteturas de memória adaptativa e habilidades de agentes, além de discutir suas compensações, práticas de avaliação e desafios futuros.

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL