cs.GT artigos | Gist.Science

Offer of a reward does not always promote trust in spatial games

O estudo demonstra que, em jogos espaciais de confiança, a oferta de recompensas não promove necessariamente a confiança, pois recompensas excessivas podem incentivar estratégias de não retorno que suprimem a evolução da confiança, enquanto recompensas moderadas e mais custosas, mas não exageradas, são mais eficazes para consolidar a cooperação.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A symmetric recursive algorithm for mean-payoff games

O artigo propõe um novo algoritmo recursivo simétrico e determinístico para resolver jogos de pagamento médio.

Pierre OhlmannTue, 10 Ma💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Este artigo investiga a dinâmica de opiniões em redes sociais multiplex, demonstrando que a interação entre camadas pode induzir ou acelerar o consenso global mesmo quando camadas individuais não o alcançam, ao mesmo tempo em que estabelece condições suficientes para estabilidade e convergência através de modelos de fusão e alternância.

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

Este trabalho propõe o "Deep Incentive Design" (DID), uma nova estrutura diferenciável que utiliza blocos de equilíbrio diferenciáveis (DEBs) para automatizar o projeto de incentivos em interações multiagentes, resolvendo com sucesso tarefas desafiadoras como design de contratos, agendamento de máquinas e problemas de equilíbrio inverso através de uma única rede neural treinada.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

O estudo demonstra que modelos de linguagem exibem viéses decisórios robustos e rígidos em tarefas de bandit de dois braços, caracterizados por baixas taxas de aprendizado e alta exploração, o que pode impactar significativamente a interação humano-IA.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Este artigo propõe um framework leve de Controle Preditivo Modelado (MPC) para anúncios de marca que utiliza regressão isotônica online para construir modelos monotônicos diretamente de dados em fluxo, eliminando a necessidade de modelos complexos de aprendizado de máquina e melhorando significativamente a eficiência de gastos e o controle de custos em comparação com estratégias de base.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Este artigo demonstra que os benchmarks atuais criam incentivos desalinhados que impedem a existência de um equilíbrio de Nash, mas prova que o protocolo de avaliação "tune-before-test" pode induzir um equilíbrio único que classifica corretamente os modelos pela sua qualidade latente.

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Este artigo apresenta o "jogo de interação enviesada" como uma ferramenta para modelar sistemas sociais sob escassez e racionalidade limitada, demonstrando como o viés gera hierarquia, cooperação e comportamentos não lineares, além de aplicar o modelo para comparar filosofias de redistribuição de riqueza como o estado de bem-estar social e a renda básica universal.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Este trabalho utiliza o framework de busca evolutiva guiada por IA, AlphaEvolve, para identificar uma nova instância de pior caso que eleva o limite inferior da razão entre o ganho de trade ótimo e o do mecanismo do Ofertador Aleatório para 2,0749, superando as estimativas anteriores.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Este artigo propõe um framework de inferência de nível 2 para inferir as estimativas que os agentes fazem dos objetivos uns dos outros, superando as limitações dos métodos tradicionais de nível 1 que assumem conhecimento completo mútuo em cenários descentralizados como a condução urbana.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artigo propõe um mecanismo de mercado local de energia que combina o Troca Combinatória de Relógio com aprendizado de máquina para simplificar a elicitação de preferências de prosumidores, permitindo que expressem necessidades complexas de forma intuitiva sem necessidade de previsão de preços, enquanto acelera a convergência para preços de liquidação.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

O artigo propõe uma extensão teórica dos jogos causais para cenários sequenciais, mas conclui, através de extensa análise empírica e teórica, que essa abordagem não oferece qualquer vantagem de bem-estar em relação ao equilíbrio de Stackelberg clássico sob racionalidade, indicando a necessidade de novos quadros teóricos além do equilíbrio de Nash para agentes de IA.

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

Este artigo demonstra que determinar se uma estratégia computável é vencedora em Yu-Gi-Oh! TCG é um problema indecidível e, na verdade, $\Pi^1_1$ -completo, reduzindo o problema da parada e o conjunto de ordens bem-ordenadas contáveis a cenários de jogo utilizando decks legais.

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Este artigo propõe e valida um novo quadro de avaliação baseado no Equilíbrio de Resposta Quantal (QRE) para medir a sofisticação estratégica de modelos de linguagem, oferecendo uma métrica contínua e teoricamente fundamentada que supera as limitações dos benchmarks atuais ao quantificar a racionalidade dos modelos em jogos estratégicos.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

O artigo apresenta o Code-Space Response Oracles (CSRO), um novo framework que substitui os oráculos de aprendizado por reforço tradicionais por Grandes Modelos de Linguagem (LLMs) para gerar políticas multiagente interpretáveis na forma de código, permitindo a descoberta de estratégias complexas e explicáveis com desempenho competitivo.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Este artigo investiga a complexidade computacional e a distorção utilitária do Voto de Votação Instantânea (IRV) em grafos, demonstrando que a verificação e o cálculo de zonas de exclusão são problemas tratáveis em tempo polinomial em árvores, mas permanecem intratáveis (co-NP-completo e NP-difícil) em grafos gerais e para regras de eliminação que satisfazem a propriedade de "Eliminação Forçada Forte".

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

Este estudo demonstra que agentes de precificação baseados em Grandes Modelos de Linguagem (LLMs) alcançam autonomamente preços e lucros supracompetitivos em cenários de oligopólio, sendo essa tendência sensível a variações sutis nos prompts e representando desafios significativos para a futura regulação de agentes de precificação por IA.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Este trabalho resolve uma questão em aberto de Gorantla et al. ao estabelecer limites superiores explícitos para a existência de alocações sem inveja na divisão justa de bens e tarefas indivisíveis entre grupos com preferências idênticas, utilizando uma técnica construtiva mais simples que se estende também a domínios contínuos.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Este artigo propõe uma abordagem estatística para sustentar a cooperação em jogos repetidos infinitos com monitoramento imperfeito, introduzindo uma estratégia genérica de "testar e punir" que utiliza inferência estatística para detectar desvios e aplicar sanções, permitindo a obtenção de resultados do tipo Teorema Popular sob condições específicas de paciência dos jogadores.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artigo demonstra que as métricas tradicionais de coordenação em jogos multiagente são cegas à estrutura temporal e podem mascarar falhas graves na alternância, propondo novas métricas sensíveis ao tempo que revelam que políticas aprendidas podem performar significativamente pior do que o acaso, apesar de apresentarem altas recompensas agregadas.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG

← Anterior Próximo →