Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Este trabajo propone CORA, un método de asignación de ventajas en el aprendizaje por refuerzo multiagente cooperativo que utiliza la teoría de juegos cooperativos y el concepto de "núcleo" para asignar créditos basados en las contribuciones de las coaliciones, mejorando así la optimización de las políticas y el comportamiento coordinado.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Este artículo presenta un modelo de expansión de capacidad estocástica en dos etapas para el emparejamiento estable en mercados de elección escolar, donde se optimiza la asignación de plazas considerando tanto la incertidumbre exógena de las preferencias como la endógena derivada de la conducta estratégica de los estudiantes, demostrando que ignorar estos comportamientos conduce a decisiones de capacidad subóptimas.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Este artículo presenta \texttt{electoral\_sim}, un marco de código abierto en Python que simula y compara diversos sistemas electorales en diferentes distribuciones de preferencias de votantes, evaluando su rendimiento mediante la distancia euclidiana al mediano geométrico e incluyendo un mecanismo hipotético basado en un kernel softmax de Boltzmann como referencia teórica.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artículo presenta \texttt{RQRE-OVI}, un algoritmo de iteración de valor optimista con aproximación de funciones lineales que calcula de manera eficiente y robusta el Equilibrio de Respuesta Cuantitativa Sensible al Riesgo (RQRE) en juegos de Markov de suma general, logrando un equilibrio único y estable que supera la fragilidad del equilibrio de Nash mediante un compromiso cuantificable entre rendimiento y robustez.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Este artículo presenta "Platooning as a Service" (PlaaS), un marco de soporte a la decisión basado en un juego de Stackelberg que optimiza la contratación de servicios de convoyes para vehículos autónomos conectados, determinando las políticas de precios y distancias óptimas para maximizar beneficios y reducir emisiones, mientras analiza el impacto de subvenciones gubernamentales y variables operativas como la velocidad y la urgencia.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Proportionality Degree in Participatory Budgeting

Este estudio inicia la investigación del grado de proporcionalidad en la presupuestación participativa, demostrando mediante límites teóricos y evaluación experimental que, aunque el Método de Cuotas Iguales (MES) ofrece garantías axiomáticas más fuertes, tanto este como la Regula Secuencial de Phragmen comparten el mismo grado de proporcionalidad desde una perspectiva cuantitativa.

Aris Filos-Ratsikas, Sreedurga Gogulapati, Georgios KalantzisWed, 11 Ma💻 cs

The Illusion of Collusion

Este estudio demuestra que los agentes algorítmicos que utilizan aprendizaje por refuerzo sin conocimiento previo de la estructura del juego pueden desarrollar una "colusión ingenua" basada en la sincronización de sus acciones, un fenómeno cuya probabilidad de ocurrencia depende críticamente de la política de comportamiento específica (estocástica, determinista o híbrida) que empleen los algoritmos.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Este artículo presenta NePPO, un nuevo pipeline de optimización de políticas para juegos de suma general que aprende una función de potencial independiente del jugador para aproximar equilibrios de Nash en entornos mixtos cooperativos-competitivos, demostrando un rendimiento superior frente a métodos baselines populares.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG