cs.MA artigos | Gist.Science

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Este artigo propõe um novo modelo de jogo de Stackelberg de três níveis que incorpora agentes não seguidores e líderes heterogêneos para corrigir previsões distorcidas em sistemas congestionados, demonstrando como a interação bidirecional entre decisões de infraestrutura, competição e congestionamento altera qualitativamente os resultados estratégicos, com aplicação ilustrada no contexto de infraestrutura de carregamento de veículos elétricos.

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

O artigo apresenta o iAgentBench, um novo benchmark dinâmico para perguntas de resposta aberta que avalia a capacidade de agentes de IA de realizar "sensemaking" (compreensão e síntese) ao integrar evidências de múltiplas fontes em tópicos de alto interesse, superando as limitações de benchmarks tradicionais que exigem apenas a recuperação de um único trecho.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens

Este artigo propõe o paradigma "Memória como Ontologia" e a arquitetura "Animesis", que redefinem a memória de agentes de IA não como uma ferramenta funcional, mas como a base ontológica da existência de cidadãos digitais persistentes, priorizando a continuidade da identidade e a governança sobre o mero desempenho de recuperação de dados.

Zhenghui Li2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Este estudo propõe um método de exploração descentralizado para equipes de robôs que combina auto-organização dinâmica e a seleção autônoma de alvos baseada em modelos de linguagem de grande escala (LLMs), validado em simulações com centenas de robôs para superar as limitações de sensores individuais e a dependência de controle centralizado.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

O artigo apresenta o SCoUT, um método de aprendizado por reforço multiagente que melhora a coordenação em ambientes parcialmente observados ao agrupar agentes temporalmente e utilizar vantagens contrafactuais para aprender de forma escalável e precisa quando e com quem comunicar, mantendo a execução descentralizada.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Este artigo apresenta uma estrutura de aprendizado por reforço multioperador que integra a teoria da escolha discreta para modelar a dinâmica competitiva de mercado em sistemas de Mobilidade Autônoma sob Demanda (AMoD), demonstrando que a concorrência leva a preços mais baixos e padrões de reposição de frota distintos em comparação com cenários monopolistas, enquanto mantém a robustez na convergência de políticas eficazes.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

O artigo apresenta o RepoLaunch, o primeiro agente capaz de automatizar a resolução de dependências, compilação e extração de resultados de testes em repositórios de código de qualquer linguagem e plataforma, permitindo a criação escalável de conjuntos de dados para treinamento e avaliação de agentes de engenharia de software.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

O artigo apresenta o Jagarin, uma arquitetura de três camadas que resolve o paradoxo de implantação de agentes de IA pessoal em dispositivos móveis, permitindo a execução eficiente e privada de tarefas obrigatórias através de um sistema de hibernação estruturada e despertar sob demanda, sem violar as políticas de sandbox ou drenar a bateria.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

O artigo apresenta o MedCoRAG, um framework de IA interpretável para diagnóstico de doenças hepáticas que combina recuperação híbrida de evidências e raciocínio colaborativo multiagente para superar as limitações de transparência e precisão dos métodos existentes.

Zheng Li, Jiayi Xu, Zhikai Hu + 4 more2026-03-06🤖 cs.AI

The effect of a toroidal opinion space on opinion bi-polarisation

Este estudo compara modelos de dinâmica de opinião em espaços toroidais e cúbicos, demonstrando que o espaço toroidal favorece a formação de um maior número de grupos em estado estacionário e exibe maior sensibilidade a extensões como confiança limitada e ponderação por agente.

Frank P. Pijpers, Benedikt V. Meylahn, Michel R. H. Mandjes2026-03-06🔬 physics

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

Este artigo propõe a Representação de Valor Baseada em Ganância (GVR), um método que garante consistência ótima em aprendizado por reforço multiagente ao transformar o nó ótimo em um único ponto de convergência através de modelagem de alvos inferiores e replay de experiências superiores, superando assim as limitações de generalização relativa dos métodos de decomposição de valor existentes.

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

$\aleph$ -IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

O artigo apresenta o $\aleph$ -IPOMDP, um quadro computacional que combina detecção de anomalias e políticas contrafactuais para permitir que agentes de IA com modelos de oponente limitados identifiquem e neutralizem a manipulação por agentes com capacidades recursivas superiores, promovendo resultados mais equitativos em jogos estratégicos.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

O artigo apresenta o HAMLET, um quadro de trabalho hierárquico e adaptativo baseado em agentes múltiplos e modelos de linguagem que gera e executa performances teatrais interativas e encarnadas em tempo real, permitindo que os atores tomem decisões autônomas baseadas em seus personagens e interajam fisicamente com o cenário, tudo avaliado por um crítico especializado.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

O artigo propõe o SEVADE, um novo framework de análise multiagente autoevolutiva com avaliação desacoplada que utiliza um motor de raciocínio dinâmico e um adjudicador de justificativas separado para superar as limitações de alucinação e precisão na detecção de sarcasmo, alcançando desempenho superior ao estado da arte em quatro conjuntos de dados de referência.

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

O artigo apresenta o VideoChat-M1, um sistema inovador de agentes múltiplos que utiliza Planejamento de Políticas Colaborativas e Aprendizado por Reforço Multiagente para otimizar dinamicamente a invocação de ferramentas e a compreensão de vídeos, alcançando desempenho superior ao estado da arte em diversos benchmarks.

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

Este trabalho demonstra que a competição multiagente com recompensas esparsas de vitória gera voos ágeis e estratégias complexas que superam métodos de treinamento individual e transferem-se com maior eficácia para o mundo real.

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

Multi-Agent Influence Diagrams to Hybrid Threat Modeling

Este artigo propõe uma abordagem inovadora baseada em diagramas de influência multiagente para modelar ameaças híbridas, permitindo avaliar a eficácia de diversas medidas de contração em um cenário de ataque cibernético a infraestruturas críticas e generalizar suas características para orientar políticas públicas.

Maarten C. Vonk, Anna V. Kononova, Thomas Bäck + 1 more2026-03-05🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

O artigo apresenta o "MoltBook", um ambiente de larga escala com mais de 770.000 agentes autônomos, e descreve a "Dinâmica de Muda" como o conjunto de comportamentos emergentes observados, revelando que, embora existam padrões de especialização de papéis e disseminação de informações, a resolução cooperativa de tarefas permanece incipiente e menos eficaz do que a atuação individual.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Este artigo avalia a capacidade de cinco Modelos de Linguagem Multimodal (MLLMs) de raciocinar sobre normas sociais em cenários baseados em texto e imagem, revelando que, embora o GPT-4o demonstre o melhor desempenho geral e supere os humanos no texto, todos os modelos apresentam dificuldades com normas complexas e têm desempenho inferior em imagens.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Este artigo formaliza o aprendizado para comunicação em ambientes parcialmente observáveis através de estruturas de informação, identificando problemas "quase-clássicos" que preservam essa estrutura após o compartilhamento de informações e desenvolvendo algoritmos de planejamento e aprendizado com complexidade comprovada para esses casos.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

← Anterior Próximo →

cs.MA