Optimal Multi-Debris Mission Planning in LEO: A Deep Reinforcement Learning Approach with Co-Elliptic Transfers and Refueling
Este artículo presenta un marco unificado de maniobras coelípticas para la eliminación de múltiples desechos espaciales en órbita terrestre baja, demostrando mediante simulaciones que un enfoque de aprendizaje por refuerzo profundo (Masked PPO) supera significativamente a los algoritmos heurísticos y de búsqueda en árbol en eficiencia y tiempo de ejecución.