Optimal Multi-Debris Mission Planning in LEO: A Deep Reinforcement Learning Approach with Co-Elliptic Transfers and Refueling
Dit artikel introduceert een op co-elliptische overgangen en tanken gebaseerd raamwerk voor het verwijderen van meerdere ruimteafvalobjecten in de lage aardbaan, waarbij Masked Proximal Policy Optimization (PPO) als deep reinforcement learning-methode aanzienlijk betere prestaties en efficiëntie toont dan traditionele greedy-algoritmen en Monte Carlo Tree Search.