ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning
Il paper presenta ARM-FM, un framework che sfrutta i modelli fondazionali per generare automaticamente macchine di ricompensa da specifiche in linguaggio naturale, consentendo un apprendimento per rinforzo compositivo e una generalizzazione zero-shot in ambienti complessi.