Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Este trabalho propõe uma abordagem baseada em otimização diferenciável e funções de barreira de controle para aprender, a partir de dados, alocações de responsabilidade que quantificam como agentes autônomos ajustam seu comportamento para garantir interações seguras e socialmente alinhadas.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

O artigo apresenta o GateLens, um agente baseado em LLM que utiliza Álgebra Relacional como representação intermediária formal para traduzir consultas em linguagem natural em código Python otimizado, superando sistemas existentes em precisão e velocidade para análise de dados tabulares complexos no setor automotivo.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabalho propõe o CORA, um método de atribuição de crédito em aprendizado por reforço multiagente cooperativo que utiliza a alocação do núcleo da teoria dos jogos cooperativos para estimar vantagens baseadas em coalizões e promover comportamentos coordenados ótimos, superando as limitações das abordagens tradicionais de compartilhamento global de vantagem.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents

Este artigo apresenta o CMASE, um quadro de trabalho para experimentos computacionais em sociedades multiagentes que integra agentes generativos com métodos etnográficos virtuais, permitindo que pesquisadores atuem como participantes embutidos para simular, interpretar e intervir em fenômenos sociais complexos com rigor causal e precisão empírica.

Hanzhong Zhang, Muhua Huang, Jindong WangWed, 11 Ma🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Este artigo propõe um novo quadro de aprendizado por reforço multiagente que utiliza um prior generalizado de comunicação com restrições e um estimador de informação mútua dual para distinguir e quantificar o impacto de mensagens com e sem perdas na tomada de decisão distribuída, demonstrando eficácia em benchmarks com limitações de comunicação.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang GaoWed, 11 Ma🤖 cs.AI

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artigo propõe um design de meta-jogo para avaliar o risco de colusão algorítmica em cenários de teste, modelando agentes com políticas pré-treinadas e regras de adaptação para analisar como estratégias de aprendizado por reforço, UCB e LLMs evoluem para cooperação ou competição em jogos de preços repetidos sob condições simétricas e assimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

O artigo apresenta o CB-MCTS, um novo algoritmo de busca em árvore Monte Carlo descentralizada que utiliza uma política estocástica baseada em Boltzmann e um bônus de entropia decrescente para superar as limitações de exploração em ambientes de recompensa esparsa ou enganosa, superando o Dec-MCTS em cenários desafiadores.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

O artigo apresenta o ChatNeuroSim, um framework baseado em agentes de modelos de linguagem que automatiza o fluxo de trabalho de simulação e otimização de aceleradores de Computação na Memória (CIM), reduzindo significativamente o tempo de exploração do espaço de design e facilitando a implantação rápida de configurações ótimas para cargas de trabalho de redes neurais profundas.

Ming-Yen Lee, Shimeng YuWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artigo apresenta o \texttt{electoral\_sim}, um framework de código aberto em Python que simula e compara diversos sistemas eleitorais em diferentes cenários de distribuição de preferências dos eleitores, utilizando a distância euclidiana para a mediana geométrica como métrica principal de desempenho e incluindo uma análise de um mecanismo hipotético baseado em kernel softmax de Boltzmann como limite teórico de referência.

Sumit MukherjeeWed, 11 Ma💻 cs

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

Este artigo apresenta o Protocolo de Delegação de LLM (LDP), um protocolo nativo de IA que introduz mecanismos de identidade e confiança para melhorar a eficiência, a governança e a segurança em sistemas multiagentes, demonstrando através de uma implementação experimental reduções significativas na latência e no consumo de tokens, embora alerte que metadados de confiança sem verificação podem prejudicar a qualidade.

Sunil PrakashWed, 11 Ma🤖 cs.AI

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artigo propõe o algoritmo \texttt{RQRE-OVI}, que utiliza aproximação linear de funções para calcular o Equilíbrio Quantal de Resposta Sensível ao Risco (RQRE) em jogos de Marko, oferecendo uma solução única, estável e robusta que supera as limitações de ineficiência computacional e fragilidade do Equilíbrio de Nash em espaços de estado grandes ou contínuos.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

O artigo apresenta o ToolRosetta, um quadro unificado que automatiza a tradução de repositórios de código de código aberto em ferramentas compatíveis com o Protocolo de Contexto de Modelo (MCP), permitindo que agentes de modelos de linguagem de grande escala executem tarefas complexas com intervenção humana mínima e garantias de segurança.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs