cs.GT articoli | Gist.Science

Characterizations of voting rules based on majority margins

Questo articolo dimostra che le regole di voto basate sui margini di maggioranza sono caratterizzate da assiomi normativi più chiari, in particolare il principio di "uguaglianza preferenziale", che garantisce un trattamento equo delle preferenze reciproche tra gli elettori.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

On the Impact of the Utility in Semivalue-based Data Valuation

Il paper introduce il concetto di "firma spaziale" per mappare i punti dati in uno spazio geometrico che semplifica l'analisi della robustezza delle valutazioni basate sui semivalori rispetto alle variazioni della funzione di utilità, proponendo una metrica pratica per quantificare tale stabilità.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Questo articolo introduce un problema di espansione stocastica della capacità in due stadi per il matching stabile, analizzando come l'incertezza sulle preferenze degli studenti, sia esogena (veridiche) che endogena (strategiche), influenzi le decisioni di pianificazione delle capacità e proponendo approcci basati sull'approssimazione della media campionaria e euristiche per ottimizzare i risultati di assegnazione.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Questo articolo introduce un design di meta-gioco per analizzare il rischio di collusione algoritmica in scenari di test-time, valutando come agenti con politiche pre-addestrate e diverse regole di adattamento possano evolvere verso la cooperazione o la competizione in giochi di pricing ripetuti.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Il paper presenta \texttt{electoral\_sim}, un framework open-source in Python che simula e confronta diversi sistemi elettorali in scenari di distribuzione degli elettori, valutandoli in base alla loro capacità di avvicinarsi alla mediana geometrica della distribuzione e includendo un meccanismo ipotetico basato su un kernel softmax di Boltzmann come limite teorico superiore.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Il paper propone \texttt{RQRE-OVI}, un algoritmo di iterazione dei valori ottimistico basato su approssimazione lineare che calcola l'Equilibrio di Risposta Quantale Sensibile al Rischio (RQRE) in giochi di Markov a somma generale, offrendo un compromesso controllabile tra prestazioni ottimali e robustezza rispetto agli errori di approssimazione e alla molteplicità degli equilibri.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Questo articolo presenta "Platooning as a Service" (PlaaS), un framework decisionale basato su un gioco di Stackelberg che ottimizza la tariffazione e l'adesione al convoglio per veicoli autonomi connessi, dimostrando come le politiche di prezzo e i sussidi governativi possano massimizzare i profitti del fornitore e ridurre le emissioni di CO₂, sebbene i benefici sul consumo di carburante siano ottimali solo a velocità moderate.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Game-Theoretic Modeling of Stealthy Intrusion Defense against MDP-Based Attackers

Questo studio presenta un modello di difesa contro le intrusioni stealth basato sulla teoria dei giochi, che analizza le interazioni strategiche tra attaccanti e difensori su grafi di attacco in tre diversi regimi informativi per derivare strategie difensive ottimali contro le minacce persistenti avanzate (APT).

Willie Kouam, Stefan RassWed, 11 Ma💻 cs

Proportionality Degree in Participatory Budgeting

Questo studio introduce il concetto di grado di proporzionalità nel budgeting partecipativo, dimostrando attraverso risultati teorici e sperimentali che, nonostante il Metodo delle Quote Uguali offra garanzie assiomatiche più forti, esso e la Regola Sequenziale di Phragmen condividono lo stesso grado di proporzionalità quantitativa.

Aris Filos-Ratsikas, Sreedurga Gogulapati, Georgios KalantzisWed, 11 Ma💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

Questo articolo dimostra, attraverso modelli teorici e simulazioni, che il protocollo MAC distribuito 802.11 porta a equilibri di Nash inefficienti in ambienti non cooperativi, mentre un protocollo ideale che separa l'allocazione della risorsa condivisa dalle strategie di trasmissione permetterebbe ai nodi razionali di raggiungere un throughput superiore.

Godfrey Tan, John GuttagWed, 11 Ma💻 cs

A Robust Multi-Item Auction Design with Statistical Learning

Questo lavoro propone un metodo di apprendimento statistico innovativo per le aste multi-prodotto che utilizza intervalli di credibilità stimati non parametricamente per semplificare l'implementazione e ridurre i costi, garantendo al contempo proprietà desiderabili come l'incentivazione alla verità e la massimizzazione del ricavo.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

The Illusion of Collusion

Lo studio dimostra che agenti algoritmici privi di informazioni dirette sui concorrenti possono sviluppare una "collusione ingenua" nei giochi ripetuti, la cui probabilità di emergere dipende criticamente dalla sincronizzazione delle azioni e dal tipo di politica di apprendimento utilizzata, variando da impossibile a certa a seconda che gli algoritmi siano persistentemente casuali, asintoticamente deterministici o puramente deterministici.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Feedback Control for Small Budget Pacing

Questo articolo propone un controller di feedback basato sull'isteresi e sulla proporzionalità che, integrando la teoria del controllo nei sistemi pubblicitari, migliora significativamente la precisione e la stabilità del pacing del budget, riducendo errori e volatilità rispetto ai metodi tradizionali.

Sreeja Apparaju, Yichuan Niu, Xixi QiTue, 10 Ma🤖 cs.LG

Informal and Privatized Transit: Incentives, Efficiency and Coordination

Questo studio sviluppa un modello teorico e propone meccanismi di intervento, come il routing gerarchico e la cross-sussidiazione, per ottimizzare l'efficienza e coordinare i sistemi di trasporto informale e privatizzato, i quali, pur essendo essenziali per la mobilità urbana, operano spesso in modo decentralizzato con conseguenti perdite di rendimento che possono essere mitigate attraverso politiche pubbliche mirate.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Questo lavoro presenta un framework ibrido HMM-POMDP per la strategia energetica della Formula 1 del 2026, che combina un modello a stati nascosti per inferire lo stato dei rivali da dati parzialmente osservabili con una rete neurale profonda per ottimizzare le decisioni di deployment energetico e rilevare strategie ingannevoli come la "counter-harvest trap".

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Il paper presenta un algoritmo basato su epoche e una corrispondente limite inferiore che caratterizzano il tasso minimax esatto per il regret nel commercio bilaterale contestuale con valutazioni a coda pesante (momento finito $p \in (1,2)$ ), interpolando tra il tasso non parametrico classico e quello lineare.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Il paper propone NePPO, un nuovo approccio di ottimizzazione delle policy per l'apprendimento multi-agente che calcola equilibri di Nash approssimati in giochi a somma generale imparando una funzione di potenziale indipendente dal giocatore per trasformare il problema originale in un gioco cooperativo.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Questo articolo dimostra come la regolamentazione della fairness basata esclusivamente sull'effetto medio del trattamento (ATE) possa essere aggirata attraverso il "masking causale", nascondendo discriminazioni sistemiche dietro una media nulla e sottolineando la necessità di valutare l'equità a livello di modello piuttosto che di decisione.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Randomise Alone, Reach as a Team

Questo articolo studia i giochi su grafi concorrenti con randomizzazione distribuita, dimostrando che le strategie senza memoria sono sufficienti per il problema della soglia (che risulta NP-difficile e in $\exists\mathbb{R}$ ) e per la raggiungibilità quasi certa (NP-completa), introducendo la logica IRATL e un solver pratico per tali problemi.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs