cs.GT artículos | Gist.Science

Offer of a reward does not always promote trust in spatial games

Mediante simulaciones numéricas en juegos espaciales de confianza, este estudio demuestra que ofrecer recompensas no siempre fomenta la confianza, ya que las recompensas excesivas pueden desencadenar estrategias de no retorno que la suprimen, mientras que recompensas moderadas y costosas son más efectivas para consolidar la cooperación.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A symmetric recursive algorithm for mean-payoff games

El artículo propone un nuevo algoritmo recursivo determinista y simétrico para resolver juegos de pago medio.

Pierre OhlmannTue, 10 Ma💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Este artículo analiza la dinámica de opiniones en redes multiplex mediante un juego de coordinación, demostrando que las interacciones entre capas pueden inducir o acelerar el consenso global incluso cuando las capas individuales no lo logran, y viceversa.

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

El artículo propone el "Deep Incentive Design" (DID), un marco diferenciable que utiliza bloques de equilibrio diferenciables (DEBs) para resolver automáticamente diversos problemas de diseño de incentivos en economía y ciencias de la computación mediante el entrenamiento de una única red neuronal capaz de manejar múltiples tareas y escalas de juegos.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

El estudio demuestra que los modelos de lenguaje grandes exhiben sesgos de decisión rígidos en tareas de bandidos de dos brazos, caracterizados por una baja tasa de aprendizaje y una alta temperatura inversa que amplifican el ruido en sesgos persistentes, lo cual tiene implicaciones críticas para la interacción humano-IA.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Este artículo propone un marco ligero de Control Predictivo de Modelos (MPC) para anuncios de marca en subastas, que utiliza regresión isotonía en línea para construir modelos de oferta directos a partir de datos en tiempo real, logrando así una mayor eficiencia en el gasto y un control de costos superior a las estrategias convencionales sin necesidad de modelos complejos de aprendizaje automático.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Este trabajo demuestra que los benchmarks actuales carecen de equilibrio de Nash y fomentan incentivos desalineados mediante el "benchmaxxing", pero propone que el protocolo "tune-before-test" garantiza un único equilibrio que clasifica correctamente los modelos según su calidad latente.

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Este artículo presenta el juego de interacción sesgado como una herramienta para modelar sistemas sociales, demostrando cómo la escasez y el poder generan jerarquías y comportamientos no lineales, y validando su utilidad para analizar desde el hipercapitalismo hasta la redistribución de la riqueza.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Este trabajo emplea el marco de búsqueda evolutiva guiada por IA AlphaEvolve para identificar un nuevo caso límite que establece un límite inferior de 2.0749 en la relación entre el beneficio social óptimo y el obtenido por el mecanismo del oferente aleatorio, superando así las cotas anteriores de 2.02.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Este artículo propone un marco de inferencia de nivel 2 para deducir las estimaciones que los agentes tienen sobre los objetivos de los demás, superando las limitaciones de los métodos tradicionales de nivel 1 que asumen un conocimiento compartido perfecto en interacciones estratégicas descentralizadas.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Este artículo presenta un mecanismo de mercado local de energía que fusiona el intercambio de relojes combinatorio con técnicas de aprendizaje automático para simplificar la elicitación de preferencias de los prosumidores, permitiéndoles expresar necesidades complejas de manera intuitiva sin necesidad de predecir precios ni utilizar formatos de oferta complicados.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Este artículo demuestra que, aunque la extensión de los juegos causales normales a entornos secuenciales es teóricamente elegante, no ofrece ninguna mejora en el bienestar social respecto al equilibrio de Stackelberg clásico bajo racionalidad, lo que sugiere la necesidad de nuevos marcos teóricos más allá del equilibrio de Nash para la inteligencia artificial agéntica.

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

El artículo demuestra que determinar si una estrategia computable es ganadora en el juego de cartas Yu-Gi-Oh! es un problema indecidible y, de hecho, completo para la clase $\Pi^1_1$ , mediante reducciones que utilizan mazos legales del juego.

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Este artículo presenta un marco de evaluación basado en el equilibrio de respuesta cuantal (QRE) para medir la sofisticación estratégica de los modelos de lenguaje, ofreciendo una métrica continua calibrada con datos humanos que supera las limitaciones de los puntajes agregados tradicionales, aunque revela una alta sensibilidad a la formulación de las instrucciones.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

El artículo presenta CSRO, un marco innovador que sustituye los oráculos de aprendizaje por refuerzo tradicionales por modelos de lenguaje grandes para generar políticas multiagente interpretables y codificadas en código humano legible, logrando un rendimiento competitivo mientras facilita la comprensión y depuración de las estrategias.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Este artículo estudia las zonas de exclusión y la distorsión del voto de segunda vuelta instantánea (IRV) en grafos no ponderados, demostrando que la verificación y el cálculo de estas zonas son problemas tratables en polinomial para árboles mediante programación dinámica, mientras que permanecen NP-duros en grafos generales y para reglas de eliminación que satisfacen la propiedad de eliminación forzada fuerte.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

El estudio demuestra que los agentes de fijación de precios basados en modelos de lenguaje grande (LLM) alcanzan autónomamente precios y beneficios supracompetitivos en entornos de oligopolio, donde variaciones mínimas en las instrucciones (prompts) influyen significativamente en estos resultados y plantean desafíos únicos para la futura regulación.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Este trabajo resuelve una pregunta abierta de Gorantla et al. al establecer cotas superiores explícitas para la existencia de asignaciones justas de bienes y tareas indivisibles entre múltiples grupos con preferencias idénticas, utilizando una técnica constructiva más sencilla que también se extiende a dominios continuos como el corte de pasteles.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Este artículo propone un enfoque estadístico basado en pruebas de hipótesis para sostener la cooperación en juegos repetidos con monitoreo imperfecto, demostrando que estrategias de "probar y castigar" permiten alcanzar un teorema folk bajo condiciones de paciencia suficiente, incluso cuando las desviaciones no pueden identificarse con certeza.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG

← Anterior Siguiente →