On the Impact of the Utility in Semivalue-based Data Valuation

Este artigo introduz o conceito de "assinatura espacial" de um conjunto de dados para mapear pontos em um espaço de baixa dimensão onde utilidades se tornam funcionais lineares, permitindo uma metodologia prática com métrica explícita para avaliar e garantir a robustez da valoração de dados baseada em semivalores frente a mudanças na escolha da utilidade.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabalho propõe o CORA, um método de atribuição de crédito em aprendizado por reforço multiagente cooperativo que utiliza a alocação do núcleo da teoria dos jogos cooperativos para estimar vantagens baseadas em coalizões e promover comportamentos coordenados ótimos, superando as limitações das abordagens tradicionais de compartilhamento global de vantagem.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Este artigo propõe um modelo de expansão de capacidade em duas etapas para mercados de pareamento estável, como a escolha escolar, que considera a incerteza nas preferências dos alunos (sejam elas verdadeiras ou estratégicas) para otimizar as decisões de capacidade e melhorar os resultados de alocação por meio de aproximações e heurísticas.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Este artigo propõe um design de meta-jogo para avaliar o risco de colusão algorítmica em cenários de teste, modelando agentes com políticas pré-treinadas e regras de adaptação para analisar como estratégias de aprendizado por reforço, UCB e LLMs evoluem para cooperação ou competição em jogos de preços repetidos sob condições simétricas e assimétricas.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artigo apresenta o \texttt{electoral\_sim}, um framework de código aberto em Python que simula e compara diversos sistemas eleitorais em diferentes cenários de distribuição de preferências dos eleitores, utilizando a distância euclidiana para a mediana geométrica como métrica principal de desempenho e incluindo uma análise de um mecanismo hipotético baseado em kernel softmax de Boltzmann como limite teórico de referência.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artigo propõe o algoritmo \texttt{RQRE-OVI}, que utiliza aproximação linear de funções para calcular o Equilíbrio Quantal de Resposta Sensível ao Risco (RQRE) em jogos de Marko, oferecendo uma solução única, estável e robusta que supera as limitações de ineficiência computacional e fragilidade do Equilíbrio de Nash em espaços de estado grandes ou contínuos.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Este artigo apresenta o "Platooning as a Service" (PlaaS), uma estrutura de suporte à decisão baseada em um jogo de Stackelberg que otimiza a interação entre provedores e usuários de veículos autônomos conectados, demonstrando como políticas de preços e subsídios governamentais podem maximizar lucros e reduzir emissões de carbono, especialmente em operações de alta velocidade e urgência.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Informal and Privatized Transit: Incentives, Efficiency and Coordination

Este artigo desenvolve um modelo teórico de jogos para analisar os incentivos em sistemas de transporte informal e privatizado, demonstrando que intervenções direcionadas, como controle centralizado parcial e subsídios cruzados, podem mitigar as perdas de eficiência causadas pelo comportamento descentralizado dos operadores, conforme validado por experimentos numéricos na Índia.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Este artigo estabelece a taxa minimax exata de arrependimento para o comércio bilateral contextual sob valorações com variância infinita, demonstrando que um algoritmo baseado em estimativa de média truncada e limites de auto-limitação alcança um desempenho ótimo que interpola entre as taxas não paramétricas clássicas e a taxa linear trivial à medida que a ordem do momento finito varia.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Este artigo propõe o NePPO, uma nova pipeline de otimização de políticas para aprendizado por reforço multiagente em jogos de soma geral que aprende uma função potencial independente dos jogadores para aproximar equilíbrios de Nash, demonstrando desempenho superior a métodos populares como MAPPO, IPPO e MADDPG.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

O artigo demonstra que a regulação de justiça baseada apenas no efeito médio de tratamento (ATE) pode ser enganosa, pois permite que sistemas otimizem objetivos como lucro ou redução de crime enquanto mascaram desigualdades causais através de confusão, o que exige uma verificação de independência condicional completa e uma regulação no nível do modelo em vez de apenas nas decisões.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Randomise Alone, Reach as a Team

Este artigo investiga jogos em grafos concorrentes com n jogadores cooperativos que utilizam randomização distribuída (sem fonte de aleatoriedade compartilhada), demonstrando que estratégias sem memória são suficientes para o problema de limiar (NP-difícil e em R\exists\mathbb{R}) e que o problema de quase-certeza é NP-completo, além de propor a lógica IRATL e um solver prático para essas questões.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs