cs.MA artigos | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

O artigo propõe o algoritmo CoHet, que utiliza motivação intrínseca baseada em Redes Neurais de Grafos (GNN) para aprimorar a cooperação entre agentes heterogêneos em ambientes de Aprendizado por Reforço Multiagente Descentralizado, superando desafios como observabilidade parcial e escassez de recompensas.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Este trabalho propõe uma abordagem baseada em otimização diferenciável e funções de barreira de controle para aprender, a partir de dados, alocações de responsabilidade que quantificam como agentes autônomos ajustam seu comportamento para garantir interações seguras e socialmente alinhadas.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Characterizations of voting rules based on majority margins

Este artigo caracteriza as regras de votação baseadas em margens de maioria, demonstrando que elas são equivalentes a regras que satisfazem axiomas com conteúdo normativo mais claro, como a Igualdade Preferencial, que garante tratamento equitativo às preferências dos eleitores.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

O artigo apresenta o GateLens, um agente baseado em LLM que utiliza Álgebra Relacional como representação intermediária formal para traduzir consultas em linguagem natural em código Python otimizado, superando sistemas existentes em precisão e velocidade para análise de dados tabulares complexos no setor automotivo.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabalho propõe o CORA, um método de atribuição de crédito em aprendizado por reforço multiagente cooperativo que utiliza a alocação do núcleo da teoria dos jogos cooperativos para estimar vantagens baseadas em coalizões e promover comportamentos coordenados ótimos, superando as limitações das abordagens tradicionais de compartilhamento global de vantagem.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Este artigo apresenta o CMASE, um quadro de trabalho para experimentos computacionais em sociedades multiagentes que integra agentes generativos com métodos etnográficos virtuais, permitindo que pesquisadores atuem como participantes embutidos para simular, interpretar e intervir em fenômenos sociais complexos com rigor causal e precisão empírica.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Personalized Collaborative Learning with Affinity-Based Variance Reduction

O artigo propõe o framework AffPCL, um método de aprendizado colaborativo personalizado que utiliza correções de viés e importância para reduzir a complexidade de amostragem de forma adaptativa, garantindo aceleração linear em cenários homogêneos e desempenho robusto sem degradação em ambientes heterogêneos, tudo sem exigir conhecimento prévio do sistema.

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

O artigo apresenta o algoritmo PULL, uma solução completa e eficiente em tempo polinomial para o problema de Rastreamento de Caminho Multiagente Não Rotulado Conectado (CUMAPF), superando as limitações de escalabilidade de abordagens baseadas em Programação Linear Inteira ao permitir o planejamento de trajetórias para centenas de agentes em grades 2D.

Takahiro Suzuki, Keisuke OkumuraWed, 11 Ma💻 cs

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Este artigo propõe um novo quadro de aprendizado por reforço multiagente que utiliza um prior generalizado de comunicação com restrições e um estimador de informação mútua dual para distinguir e quantificar o impacto de mensagens com e sem perdas na tomada de decisão distribuída, demonstrando eficácia em benchmarks com limitações de comunicação.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artigo propõe um design de meta-jogo para avaliar o risco de colusão algorítmica em cenários de teste, modelando agentes com políticas pré-treinadas e regras de adaptação para analisar como estratégias de aprendizado por reforço, UCB e LLMs evoluem para cooperação ou competição em jogos de preços repetidos sob condições simétricas e assimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

O artigo apresenta o CB-MCTS, um novo algoritmo de busca em árvore Monte Carlo descentralizada que utiliza uma política estocástica baseada em Boltzmann e um bônus de entropia decrescente para superar as limitações de exploração em ambientes de recompensa esparsa ou enganosa, superando o Dec-MCTS em cenários desafiadores.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

O artigo apresenta o ChatNeuroSim, um framework baseado em agentes de modelos de linguagem que automatiza o fluxo de trabalho de simulação e otimização de aceleradores de Computação na Memória (CIM), reduzindo significativamente o tempo de exploração do espaço de design e facilitando a implantação rápida de configurações ótimas para cargas de trabalho de redes neurais profundas.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artigo apresenta o \texttt{electoral\_sim}, um framework de código aberto em Python que simula e compara diversos sistemas eleitorais em diferentes cenários de distribuição de preferências dos eleitores, utilizando a distância euclidiana para a mediana geométrica como métrica principal de desempenho e incluindo uma análise de um mecanismo hipotético baseado em kernel softmax de Boltzmann como limite teórico de referência.

Sumit MukherjeeWed, 11 Ma💻 cs

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

O artigo apresenta o Scale-Plan, um framework escalável que utiliza raciocínio de modelos de linguagem (LLM) para filtrar informações irrelevantes e gerar representações de problemas compactas, permitindo um planejamento de tarefas eficiente e confiável para equipes heterogêneas de múltiplos robôs em ambientes complexos.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Este artigo apresenta o Protocolo de Delegação de LLM (LDP), um protocolo nativo de IA que introduz mecanismos de identidade e confiança para melhorar a eficiência, a governança e a segurança em sistemas multiagentes, demonstrando através de uma implementação experimental reduções significativas na latência e no consumo de tokens, embora alerte que metadados de confiança sem verificação podem prejudicar a qualidade.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges

Este artigo propõe um quadro unificado de modelos de mundo latente para a condução autónoma, estabelecendo uma taxonomia abrangente, identificando cinco mecanismos internos críticos, definindo métricas de avaliação de ciclo fechado e delineando desafios futuros para garantir sistemas robustos, generalizáveis e eficientes.

Rongxiang Zeng, Yongqi DongWed, 11 Ma🤖 cs.AI

Chaotic Dynamics in Multi-LLM Deliberation

Este artigo demonstra que sistemas de deliberação multi-LLM exibem instabilidade caótica e sensibilidade às condições iniciais mesmo em regimes esperados como determinísticos, identificando a diferenciação de papéis e a heterogeneidade de modelos como causas principais e sugerindo auditorias de estabilidade como requisito essencial para o design desses sistemas.

Hajime Shimao, Warut Khern-am-nuai, Sung Joo KimWed, 11 Ma🤖 cs.AI

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

O artigo apresenta o AgenticCyOps, um quadro de segurança que define princípios defensivos e limites de confiança para mitigar riscos de integração em sistemas multiagentes empresariais, demonstrando uma redução significativa de superfícies de ataque em fluxos de trabalho de operações de cibersegurança.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artigo propõe o algoritmo \texttt{RQRE-OVI}, que utiliza aproximação linear de funções para calcular o Equilíbrio Quantal de Resposta Sensível ao Risco (RQRE) em jogos de Marko, oferecendo uma solução única, estável e robusta que supera as limitações de ineficiência computacional e fragilidade do Equilíbrio de Nash em espaços de estado grandes ou contínuos.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

O artigo apresenta o ToolRosetta, um quadro unificado que automatiza a tradução de repositórios de código de código aberto em ferramentas compatíveis com o Protocolo de Contexto de Modelo (MCP), permitindo que agentes de modelos de linguagem de grande escala executem tarefas complexas com intervenção humana mínima e garantias de segurança.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs