cs.GT Arbeiten | Gist.Science

Offer of a reward does not always promote trust in spatial games

Die Studie zeigt, dass Belohnungen in räumlichen Vertrauensspielen das Vertrauen nicht zwangsläufig fördern, da übermäßige Belohnungen zu einer Nicht-Rückzahlung führen und mittlere, aber kostspieligere Belohnungen effektiver sind als geringe Kosten, um Vertrauenscluster zu stabilisieren.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A symmetric recursive algorithm for mean-payoff games

Die Autoren stellen einen neuen deterministischen, symmetrischen rekursiven Algorithmus zur Lösung von Mittelwertspielen vor.

Pierre OhlmannTue, 10 Ma💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Diese Arbeit untersucht die Meinungs dynamik in Multiplex-Netzwerken durch die Formulierung als koordinatives Spiel, wobei sie mittels spektraler Analyse zeigt, wie vernetzte Schichten sowohl die Konsensbildung beschleunigen als auch destabilisieren können.

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

Die Arbeit stellt Deep Incentive Design (DID) vor, ein differenzierbares Framework, das game-agnostische differentiable equilibrium blocks (DEBs) nutzt, um komplexe Anreizdesign-Probleme in Wirtschaft und Informatik durch das Training eines einzigen neuronalen Netzwerks zu lösen.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Die Studie zeigt, dass Large Language Models in Zwei-Armen-Bandit-Szenarien trotz Variationen der Dekodierungsparameter robuste, rigide Entscheidungsverzerrungen aufweisen, die durch niedrige Lernraten und hohe Inverse-Temperaturen erklärt werden und potenzielle Auswirkungen auf die Mensch-KI-Interaktion haben.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Dieses Papier stellt einen leichtgewichtigen, vollständig online arbeitenden Model-Predictive-Control-Rahmen vor, der mittels isotonischer Regression auf Streaming-Daten bidirektionale Modelle für Markenwerbung erstellt und so im Vergleich zu Baseline-Strategien die Ausgaben-effizienz und Kostenkontrolle erheblich verbessert.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Die Studie zeigt, dass aktuelle Benchmark-Verfahren zu nicht-existierenden Nash-Gleichgewichten und damit zu fehlgeleiteten Anreizen für das „Benchmaxxing" führen, während ein neu vorgeschlagenes „Tune-before-Test"-Protokoll unter milden Bedingungen ein eindeutiges Gleichgewicht garantiert, das Modelle korrekt nach ihrer latenten Qualität bewertet.

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Diese Arbeit untersucht die Dynamik des voreingenommenen Interaktionsspiels als Modell für soziale Systeme, um zu zeigen, wie Voreingenommenheit und Knappheit Hierarchien, Ungleichheit und nichtlineares Verhalten erzeugen, und wendet das Modell erfolgreich auf extreme Gesellschaftsformen sowie den Vergleich von Sozialhilfe und bedingungslosem Grundeinkommen an.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Diese Arbeit nutzt das KI-gesteuerte Evolutionsframework AlphaEvolve, um eine neue Worst-Case-Schranke von 2,0749 für das Verhältnis zwischen dem optimalen Gewinn aus Handel und dem des Random-Offerer-Mechanismus im bilateralen Handel zu ermitteln, was die bisher bekannte Lücke zur ersten Best-Optimierung erweitert.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Die Arbeit stellt ein neues Framework für die Level-2-Inferenz vor, das in dezentralen Szenarien wie dem autonomen Fahren die Schätzungen von Agenten über die Ziele anderer erfasst, um die Beschränkungen bestehender Level-1-Methoden zu überwinden, die fälschlicherweise von vollständigem Wissen über die Ziele aller Akteure ausgehen.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Diese Arbeit stellt einen neuartigen lokalen Energiemarkt vor, der durch die Kombination des kombinatorischen Auktionsmechanismus mit maschinellem Lernen komplexe Präferenzen von Prosumern in einem intuitiven Format erfasst und so die Preisfindung beschleunigt sowie die Transparenz erhöht.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Die Arbeit zeigt, dass die Erweiterung von kausalen Normalformspielen auf sequenzielle Szenarien trotz theoretischer Eleganz und PSPACE-Vollständigkeit in der Praxis keine Wohlfahrtsverbesserung gegenüber klassischen Stackelberg-Gleichgewichten bietet, da rationale Rückwärtsinduktion kausale Vorteile eliminiert und somit neue theoretische Rahmenwerke jenseits des Nash-Gleichgewichts für KI-Agenten erforderlich macht.

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

Die Autoren zeigen, dass die Frage, ob eine gegebene berechenbare Strategie im Yu-Gi-Oh!-TCG von einem bestimmten Spielzustand aus gewinnt, unentscheidbar und sogar $\Pi^1_1$ -vollständig ist, indem sie das Problem auf die Menge der abzählbaren Wohlordnungen reduzieren und dabei legale Decks verwenden.

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Diese Arbeit stellt ein spieltheoretisches Evaluierungsframework vor, das das Quantal Response Equilibrium nutzt, um die strategische Raffinesse von Large Language Models auf einer kontinuierlichen Skala zu messen und dabei theoretische Fundierung, empirische Validierung sowie Hinweise auf Prompt-Sensitivität liefert.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Die Arbeit stellt Code-Space Response Oracles (CSRO) vor, ein neuartiges Framework, das in Multi-Agenten-Systemen herkömmliche Reinforcement-Learning-Orakel durch Large Language Models ersetzt, um direkt als menschenlesbarer Code generierte, interpretierbare und wettbewerbsfähige Strategien zu ermöglichen.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Die Arbeit untersucht die Komplexität von Ausschlusszonen und der Verzerrung beim Instant-Runoff-Voting auf Graphen und zeigt, dass beide Probleme auf Bäumen in Polynomialzeit lösbar sind, während sie für allgemeine Graphen bzw. für eine Klasse von Abstimmungsregeln mit der Eigenschaft „Strong Forced Elimination" NP-schwer bzw. co-NP-vollständig bleiben.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

Die Studie zeigt, dass auf Large Language Models basierende Preisgestaltungsagenten in Oligopolen autonom zu überkompetitiven Preisen und Gewinnen neigen, wobei bereits subtile Änderungen in den Prompts das Ausmaß dieser Kollusion erheblich beeinflussen und neue regulatorische Herausforderungen aufwerfen.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Diese Arbeit löst eine offene Frage von Gorantla et al., indem sie explizite obere Schranken für die Anzahl der benötigten Kopien von Gütern und Aufgaben herleitet, um eine faire Zuteilung unter beliebigen Gruppen und Präferenzen zu garantieren, und dabei eine vereinfachte, konstruktive Methode einführt, die sich auch auf andere faire Teilungsprobleme erweitern lässt.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Die Arbeit entwickelt einen statistischen „Test-then-Punish"-Ansatz für wiederholte Spiele mit unvollkommener Überwachung, der durch die Einbettung von Hypothesentests in strategisches Verhalten und die Verwendung relaxierter Gleichgewichtsbegriffe zeigt, dass auch unter Unsicherheit über Abweichungen ein Folk-Theorem-Ergebnis erzielt werden kann.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Diese Studie zeigt, dass herkömmliche, zeitunabhängige Leistungsmetriken in Multi-Agenten-Szenarien koordinierte Verhaltensmuster wie Turn-taking oft übersehen, und führt daher neue, zeitlich sensitive Alternationsmetriken ein, die offenbaren, dass selbst lernbasierte Strategien trotz hoher aggregierter Belohnungen signifikant schlechter koordinieren als zufällige Baselines.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG

← Zurück Weiter →