cs.GT artigos | Gist.Science

Characterizations of voting rules based on majority margins

Este artigo caracteriza as regras de votação baseadas em margens de maioria, demonstrando que elas são equivalentes a regras que satisfazem axiomas com conteúdo normativo mais claro, como a Igualdade Preferencial, que garante tratamento equitativo às preferências dos eleitores.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

On the Impact of the Utility in Semivalue-based Data Valuation

Este artigo introduz o conceito de "assinatura espacial" de um conjunto de dados para mapear pontos em um espaço de baixa dimensão onde utilidades se tornam funcionais lineares, permitindo uma metodologia prática com métrica explícita para avaliar e garantir a robustez da valoração de dados baseada em semivalores frente a mudanças na escolha da utilidade.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabalho propõe o CORA, um método de atribuição de crédito em aprendizado por reforço multiagente cooperativo que utiliza a alocação do núcleo da teoria dos jogos cooperativos para estimar vantagens baseadas em coalizões e promover comportamentos coordenados ótimos, superando as limitações das abordagens tradicionais de compartilhamento global de vantagem.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Este artigo propõe um modelo de expansão de capacidade em duas etapas para mercados de pareamento estável, como a escolha escolar, que considera a incerteza nas preferências dos alunos (sejam elas verdadeiras ou estratégicas) para otimizar as decisões de capacidade e melhorar os resultados de alocação por meio de aproximações e heurísticas.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artigo propõe um design de meta-jogo para avaliar o risco de colusão algorítmica em cenários de teste, modelando agentes com políticas pré-treinadas e regras de adaptação para analisar como estratégias de aprendizado por reforço, UCB e LLMs evoluem para cooperação ou competição em jogos de preços repetidos sob condições simétricas e assimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artigo apresenta o \texttt{electoral\_sim}, um framework de código aberto em Python que simula e compara diversos sistemas eleitorais em diferentes cenários de distribuição de preferências dos eleitores, utilizando a distância euclidiana para a mediana geométrica como métrica principal de desempenho e incluindo uma análise de um mecanismo hipotético baseado em kernel softmax de Boltzmann como limite teórico de referência.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artigo propõe o algoritmo \texttt{RQRE-OVI}, que utiliza aproximação linear de funções para calcular o Equilíbrio Quantal de Resposta Sensível ao Risco (RQRE) em jogos de Marko, oferecendo uma solução única, estável e robusta que supera as limitações de ineficiência computacional e fragilidade do Equilíbrio de Nash em espaços de estado grandes ou contínuos.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Este artigo apresenta o "Platooning as a Service" (PlaaS), uma estrutura de suporte à decisão baseada em um jogo de Stackelberg que otimiza a interação entre provedores e usuários de veículos autônomos conectados, demonstrando como políticas de preços e subsídios governamentais podem maximizar lucros e reduzir emissões de carbono, especialmente em operações de alta velocidade e urgência.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Game-Theoretic Modeling of Stealthy Intrusion Defense against MDP-Based Attackers

Este artigo propõe um modelo de teoria dos jogos para otimizar estratégias de defesa contra ameaças persistentes avançadas (APTs) em grafos de ataque, considerando a assimetria temporal e três regimes de informação distintos (Stackelberg, cego e baseado em crenças) para determinar a alocação ideal de sensores de detecção de intrusão.

Willie Kouam, Stefan RassWed, 11 Ma💻 cs

Proportionality Degree in Participatory Budgeting

Este estudo inicia a análise do grau de proporcionalidade no orçamento participativo, demonstrando teoricamente e validando experimentalmente que, embora o Método das Partes Iguais (MES) ofereça garantias axiomáticas mais fortes, ele e a Regra Sequencial de Phragmen apresentam o mesmo grau de proporcionalidade quantitativa.

Aris Filos-Ratsikas, Sreedurga Gogulapati, Georgios KalantzisWed, 11 Ma💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

Este artigo demonstra, por meio de modelagem teórica e simulação, que o protocolo MAC 802.11 DCF pode levar nós não cooperativos a equilíbrios de Nash ineficientes, mas propõe que um protocolo ideal que desacople a alocação do canal das estratégias de transmissão pode resultar em equilíbrios com maior throughput para todos os nós.

Godfrey Tan, John GuttagWed, 11 Ma💻 cs

A Robust Multi-Item Auction Design with Statistical Learning

Este artigo propõe um novo método de aprendizado estatístico para leilões de múltiplos itens que utiliza intervalos de credibilidade para reduzir custos de implementação, mantendo a justiça e a compatibilidade de incentivos com alta probabilidade enquanto maximiza a receita.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

The Illusion of Collusion

O estudo demonstra que agentes de aprendizado por reforço sem contexto podem desenvolver uma "colusão ingênua" em jogos repetidos, onde a emergência desse comportamento anticompetitivo depende criticamente da sincronia das ações e do tipo de política de exploração utilizada, variando de impossível em algoritmos persistentemente aleatórios a inevitável em algoritmos determinísticos.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Feedback Control for Small Budget Pacing

Este artigo propõe um controlador de feedback principiado que combina histerese em buckets com controle proporcional para otimizar o ritmo de gastos em campanhas de publicidade online de baixo orçamento, demonstrando melhorias significativas na precisão e estabilidade em comparação com métodos existentes.

Sreeja Apparaju, Yichuan Niu, Xixi QiTue, 10 Ma🤖 cs.LG

Informal and Privatized Transit: Incentives, Efficiency and Coordination

Este artigo desenvolve um modelo teórico de jogos para analisar os incentivos em sistemas de transporte informal e privatizado, demonstrando que intervenções direcionadas, como controle centralizado parcial e subsídios cruzados, podem mitigar as perdas de eficiência causadas pelo comportamento descentralizado dos operadores, conforme validado por experimentos numéricos na Índia.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Este artigo apresenta um framework híbrido que combina um Modelo de Markov Oculto para inferir estados ocultos de rivais e uma Rede Q Profunda para otimizar a estratégia de energia em corridas de Fórmula 1 de 2026, permitindo a detecção de armadilhas estratégicas como o "counter-harvest" em um ambiente de observabilidade parcial.

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Este artigo estabelece a taxa minimax exata de arrependimento para o comércio bilateral contextual sob valorações com variância infinita, demonstrando que um algoritmo baseado em estimativa de média truncada e limites de auto-limitação alcança um desempenho ótimo que interpola entre as taxas não paramétricas clássicas e a taxa linear trivial à medida que a ordem do momento finito varia.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Este artigo propõe o NePPO, uma nova pipeline de otimização de políticas para aprendizado por reforço multiagente em jogos de soma geral que aprende uma função potencial independente dos jogadores para aproximar equilíbrios de Nash, demonstrando desempenho superior a métodos populares como MAPPO, IPPO e MADDPG.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

O artigo demonstra que a regulação de justiça baseada apenas no efeito médio de tratamento (ATE) pode ser enganosa, pois permite que sistemas otimizem objetivos como lucro ou redução de crime enquanto mascaram desigualdades causais através de confusão, o que exige uma verificação de independência condicional completa e uma regulação no nível do modelo em vez de apenas nas decisões.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Randomise Alone, Reach as a Team

Este artigo investiga jogos em grafos concorrentes com n jogadores cooperativos que utilizam randomização distribuída (sem fonte de aleatoriedade compartilhada), demonstrando que estratégias sem memória são suficientes para o problema de limiar (NP-difícil e em $\exists\mathbb{R}$ ) e que o problema de quase-certeza é NP-completo, além de propor a lógica IRATL e um solver prático para essas questões.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs