Boosting deep Reinforcement Learning using pretraining with Logical Options
Il paper propone H²RL, un approccio ibrido che utilizza un preaddestramento basato su opzioni logiche per allineare gli agenti di apprendimento per rinforzo profondo, migliorando le decisioni a lungo termine e superando le prestazioni di baselines neurali, simboliche e neuro-simboliche.