Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets
Este artigo caracteriza o equilíbrio de Nash para mercados de créditos de carbono e demonstra, por meio de experimentos numéricos utilizando o algoritmo Nash-DQN, que a aplicação de aprendizado por reforço permite que empresas emissorres alcancem economias financeiras significativas ao aderir a esse equilíbrio.