Offer of a reward does not always promote trust in spatial games

Mediante simulaciones numéricas en juegos espaciales de confianza, este estudio demuestra que ofrecer recompensas no siempre fomenta la confianza, ya que las recompensas excesivas pueden desencadenar estrategias de no retorno que la suprimen, mientras que recompensas moderadas y costosas son más efectivas para consolidar la cooperación.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Este artículo propone un marco ligero de Control Predictivo de Modelos (MPC) para anuncios de marca en subastas, que utiliza regresión isotonía en línea para construir modelos de oferta directos a partir de datos en tiempo real, logrando así una mayor eficiencia en el gasto y un control de costos superior a las estrategias convencionales sin necesidad de modelos complejos de aprendizaje automático.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artículo presenta un mecanismo de mercado local de energía que fusiona el intercambio de relojes combinatorio con técnicas de aprendizaje automático para simplificar la elicitación de preferencias de los prosumidores, permitiéndoles expresar necesidades complejas de manera intuitiva sin necesidad de predecir precios ni utilizar formatos de oferta complicados.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Este artículo presenta un marco de evaluación basado en el equilibrio de respuesta cuantal (QRE) para medir la sofisticación estratégica de los modelos de lenguaje, ofreciendo una métrica continua calibrada con datos humanos que supera las limitaciones de los puntajes agregados tradicionales, aunque revela una alta sensibilidad a la formulación de las instrucciones.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

El artículo presenta CSRO, un marco innovador que sustituye los oráculos de aprendizaje por refuerzo tradicionales por modelos de lenguaje grandes para generar políticas multiagente interpretables y codificadas en código humano legible, logrando un rendimiento competitivo mientras facilita la comprensión y depuración de las estrategias.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Este artículo estudia las zonas de exclusión y la distorsión del voto de segunda vuelta instantánea (IRV) en grafos no ponderados, demostrando que la verificación y el cálculo de estas zonas son problemas tratables en polinomial para árboles mediante programación dinámica, mientras que permanecen NP-duros en grafos generales y para reglas de eliminación que satisfacen la propiedad de eliminación forzada fuerte.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Este trabajo resuelve una pregunta abierta de Gorantla et al. al establecer cotas superiores explícitas para la existencia de asignaciones justas de bienes y tareas indivisibles entre múltiples grupos con preferencias idénticas, utilizando una técnica constructiva más sencilla que también se extiende a dominios continuos como el corte de pasteles.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Este artículo propone un enfoque estadístico basado en pruebas de hipótesis para sostener la cooperación en juegos repetidos con monitoreo imperfecto, demostrando que estrategias de "probar y castigar" permiten alcanzar un teorema folk bajo condiciones de paciencia suficiente, incluso cuando las desviaciones no pueden identificarse con certeza.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG