Optimal Multi-Debris Mission Planning in LEO: A Deep Reinforcement Learning Approach with Co-Elliptic Transfers and Refueling
本論文は、低軌道上の複数の宇宙デブリ除去ミッション計画に対し、共楕円軌道移動と補給ロジックを統合したフレームワークを提案し、現実的なシミュレーション環境において、貪欲法やモンテカルロ木探索と比較して、マスク付き PPO を用いた強化学習が、より多くのデブリを効率的かつ高速に除去できることを実証しています。