Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems
Dit paper introduceert een nieuw bi-niveau optimalisatie-algoritme genaamd DS-PPO, gebaseerd op multi-agent versterkende leer, dat de uitdagingen van verouderde kanaalstatusinformatie (CSI) in multi-satellietcommunicatiesystemen effectief aanpakt door de totale doorvoer te maximaliseren via zowel individuele als gecoördineerde satellietacties.