Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks
Diese Studie analysiert die Robustheit von Reinforcement-Learning-Policies, indem sie interne synaptische Filterung und externe adversarische Angriffe kombiniert, um Parameter als fragil, robust oder antifragil zu klassifizieren und damit die Grundlage für widerstandsfähigere RL-Systeme zu schaffen.