Combining Tree-Search, Generative Models, and Nash Bargaining Concepts in Game-Theoretic Reinforcement Learning
Deze paper introduceert een schaalbaar, generatief reinforcement learning-framework dat Monte-Carlo Tree Search, diepe generatieve modellen en Nash-verhandelingsconcepten combineert om effectieve online en offline tegenstandersmodellen te ontwikkelen voor complexe spelletjes met imperfecte informatie, zoals aangetoond in onderhandelingsexperimenten met mensen.