Offer of a reward does not always promote trust in spatial games

O estudo demonstra que, em jogos espaciais de confiança, a oferta de recompensas não promove necessariamente a confiança, pois recompensas excessivas podem incentivar estratégias de não retorno que suprimem a evolução da confiança, enquanto recompensas moderadas e mais custosas, mas não exageradas, são mais eficazes para consolidar a cooperação.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

Este trabalho propõe o "Deep Incentive Design" (DID), uma nova estrutura diferenciável que utiliza blocos de equilíbrio diferenciáveis (DEBs) para automatizar o projeto de incentivos em interações multiagentes, resolvendo com sucesso tarefas desafiadoras como design de contratos, agendamento de máquinas e problemas de equilíbrio inverso através de uma única rede neural treinada.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

Este artigo propõe um framework leve de Controle Preditivo Modelado (MPC) para anúncios de marca que utiliza regressão isotônica online para construir modelos monotônicos diretamente de dados em fluxo, eliminando a necessidade de modelos complexos de aprendizado de máquina e melhorando significativamente a eficiência de gastos e o controle de custos em comparação com estratégias de base.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Este artigo apresenta o "jogo de interação enviesada" como uma ferramenta para modelar sistemas sociais sob escassez e racionalidade limitada, demonstrando como o viés gera hierarquia, cooperação e comportamentos não lineares, além de aplicar o modelo para comparar filosofias de redistribuição de riqueza como o estado de bem-estar social e a renda básica universal.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artigo propõe um mecanismo de mercado local de energia que combina o Troca Combinatória de Relógio com aprendizado de máquina para simplificar a elicitação de preferências de prosumidores, permitindo que expressem necessidades complexas de forma intuitiva sem necessidade de previsão de preços, enquanto acelera a convergência para preços de liquidação.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Este artigo propõe e valida um novo quadro de avaliação baseado no Equilíbrio de Resposta Quantal (QRE) para medir a sofisticação estratégica de modelos de linguagem, oferecendo uma métrica contínua e teoricamente fundamentada que supera as limitações dos benchmarks atuais ao quantificar a racionalidade dos modelos em jogos estratégicos.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

O artigo apresenta o Code-Space Response Oracles (CSRO), um novo framework que substitui os oráculos de aprendizado por reforço tradicionais por Grandes Modelos de Linguagem (LLMs) para gerar políticas multiagente interpretáveis na forma de código, permitindo a descoberta de estratégias complexas e explicáveis com desempenho competitivo.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Este artigo investiga a complexidade computacional e a distorção utilitária do Voto de Votação Instantânea (IRV) em grafos, demonstrando que a verificação e o cálculo de zonas de exclusão são problemas tratáveis em tempo polinomial em árvores, mas permanecem intratáveis (co-NP-completo e NP-difícil) em grafos gerais e para regras de eliminação que satisfazem a propriedade de "Eliminação Forçada Forte".

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Este artigo propõe uma abordagem estatística para sustentar a cooperação em jogos repetidos infinitos com monitoramento imperfeito, introduzindo uma estratégia genérica de "testar e punir" que utiliza inferência estatística para detectar desvios e aplicar sanções, permitindo a obtenção de resultados do tipo Teorema Popular sob condições específicas de paciência dos jogadores.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artigo demonstra que as métricas tradicionais de coordenação em jogos multiagente são cegas à estrutura temporal e podem mascarar falhas graves na alternância, propondo novas métricas sensíveis ao tempo que revelam que políticas aprendidas podem performar significativamente pior do que o acaso, apesar de apresentarem altas recompensas agregadas.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG