Smart Walkers in Discrete Space
Die Studie untersucht statistische Eigenschaften von trainierbaren Agenten in diskretem Raum, zeigt, wie Reinforcement Learning die Begegnungsstatistik optimiert und demonstriert, dass die Konfigurationsentropie als zuverlässiges Maß für die erlernten Fähigkeiten dient, was durch Experimente mit dem Schachprogramm Stockfish bestätigt wird.