Contact-Safe Reinforcement Learning with ProMP Reparameterization and Energy Awareness
Diese Arbeit stellt ein kontakt-sicheres Reinforcement-Learning-Framework vor, das Proximal Policy Optimization mit Bewegungsprimitiven und einem energiebewussten kartesischen Impedanzregler kombiniert, um robuste und sichere Manipulationsaufgaben in komplexen 3D-Umgebungen zu bewältigen.