BlackMirror: Black-Box Backdoor Detection for Text-to-Image Models via Instruction-Response Deviation
Dit paper introduceert BlackMirror, een trainingsvrij black-box raamwerk dat backdoors in text-to-image-modellen detecteert door instructie-responsafwijkingen te analyseren in plaats van alleen op visuele gelijkenis te vertrouwen.