CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions
Este artículo presenta CBF-RL, un marco que integra Funciones de Barrera de Control (CBF) directamente en el entrenamiento de aprendizaje por refuerzo para internalizar restricciones de seguridad en la política aprendida, permitiendo un despliegue seguro y robusto en robots reales sin necesidad de filtros de seguridad en tiempo de ejecución.