Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance
본 연구는 다중 파편 능동 제거 임무를 수행하는 소형 위성을 위해 연료 효율적이고 적응적인 충돌 회피 및 재충전 전략을 최적화하는 마스크드 근사 정책 최 optimization(PPO) 강화 학습 프레임워크를 제안하며, 복잡한 궤도 환경에서 전통적인 휴리스틱 방식보다 우수한 성능을 입증한다.