Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance
Questo studio propone un framework di apprendimento per rinforzo basato su Proximal Policy Optimization (PPO) mascherato che ottimizza strategie di rifornimento e di evitamento delle collisioni adattive e a basso consumo di carburante per piccoli satelliti che conducono missioni di rimozione attiva di detriti multipli, dimostrando prestazioni superiori rispetto ai tradizionali approcci euristici in ambienti orbitali complessi.