Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance
本研究は、複数のデブリ除去ミッションを行う小型衛星のための、燃料効率が高く適応的な衝突回避および燃料補給戦略を最適化する、マスク付き近接方策最適化(PPO)強化学習フレームワークを提案し、複雑な軌道環境において従来のヒューリスティックな手法よりも優れた性能を実証するものである。