Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Este artigo propõe um novo modelo de jogo de Stackelberg de três níveis que incorpora agentes não seguidores e líderes heterogêneos para corrigir previsões distorcidas em sistemas congestionados, demonstrando como a interação bidirecional entre decisões de infraestrutura, competição e congestionamento altera qualitativamente os resultados estratégicos, com aplicação ilustrada no contexto de infraestrutura de carregamento de veículos elétricos.

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

O artigo apresenta o iAgentBench, um novo benchmark dinâmico para perguntas de resposta aberta que avalia a capacidade de agentes de IA de realizar "sensemaking" (compreensão e síntese) ao integrar evidências de múltiplas fontes em tópicos de alto interesse, superando as limitações de benchmarks tradicionais que exigem apenas a recuperação de um único trecho.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Este estudo propõe um método de exploração descentralizado para equipes de robôs que combina auto-organização dinâmica e a seleção autônoma de alvos baseada em modelos de linguagem de grande escala (LLMs), validado em simulações com centenas de robôs para superar as limitações de sensores individuais e a dependência de controle centralizado.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

O artigo apresenta o SCoUT, um método de aprendizado por reforço multiagente que melhora a coordenação em ambientes parcialmente observados ao agrupar agentes temporalmente e utilizar vantagens contrafactuais para aprender de forma escalável e precisa quando e com quem comunicar, mantendo a execução descentralizada.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Este artigo apresenta uma estrutura de aprendizado por reforço multioperador que integra a teoria da escolha discreta para modelar a dinâmica competitiva de mercado em sistemas de Mobilidade Autônoma sob Demanda (AMoD), demonstrando que a concorrência leva a preços mais baixos e padrões de reposição de frota distintos em comparação com cenários monopolistas, enquanto mantém a robustez na convergência de políticas eficazes.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

O artigo apresenta o RepoLaunch, o primeiro agente capaz de automatizar a resolução de dependências, compilação e extração de resultados de testes em repositórios de código de qualquer linguagem e plataforma, permitindo a criação escalável de conjuntos de dados para treinamento e avaliação de agentes de engenharia de software.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

Este artigo propõe a Representação de Valor Baseada em Ganância (GVR), um método que garante consistência ótima em aprendizado por reforço multiagente ao transformar o nó ótimo em um único ponto de convergência através de modelagem de alvos inferiores e replay de experiências superiores, superando assim as limitações de generalização relativa dos métodos de decomposição de valor existentes.

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

\aleph-IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

O artigo apresenta o \aleph-IPOMDP, um quadro computacional que combina detecção de anomalias e políticas contrafactuais para permitir que agentes de IA com modelos de oponente limitados identifiquem e neutralizem a manipulação por agentes com capacidades recursivas superiores, promovendo resultados mais equitativos em jogos estratégicos.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

O artigo apresenta o HAMLET, um quadro de trabalho hierárquico e adaptativo baseado em agentes múltiplos e modelos de linguagem que gera e executa performances teatrais interativas e encarnadas em tempo real, permitindo que os atores tomem decisões autônomas baseadas em seus personagens e interajam fisicamente com o cenário, tudo avaliado por um crítico especializado.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

O artigo propõe o SEVADE, um novo framework de análise multiagente autoevolutiva com avaliação desacoplada que utiliza um motor de raciocínio dinâmico e um adjudicador de justificativas separado para superar as limitações de alucinação e precisão na detecção de sarcasmo, alcançando desempenho superior ao estado da arte em quatro conjuntos de dados de referência.

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

O artigo apresenta o "MoltBook", um ambiente de larga escala com mais de 770.000 agentes autônomos, e descreve a "Dinâmica de Muda" como o conjunto de comportamentos emergentes observados, revelando que, embora existam padrões de especialização de papéis e disseminação de informações, a resolução cooperativa de tarefas permanece incipiente e menos eficaz do que a atuação individual.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Este artigo avalia a capacidade de cinco Modelos de Linguagem Multimodal (MLLMs) de raciocinar sobre normas sociais em cenários baseados em texto e imagem, revelando que, embora o GPT-4o demonstre o melhor desempenho geral e supere os humanos no texto, todos os modelos apresentam dificuldades com normas complexas e têm desempenho inferior em imagens.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI