Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors
Dit paper toont aan dat bestaande verdedigingen tegen backdoors ontoereikend zijn omdat ze zich uitsluitend op de invoer-trigger richten, terwijl alternatieve triggers dezelfde kwetsbaarheid in de feature-ruimte kunnen activeren, wat een verschuiving vereist naar verdedigingen die zich richten op de backdoor-richting in de representatieruimte.