What Helps---and What Hurts: Bidirectional Explanations for Vision Transformers
Il paper presenta BiCAM, un metodo di mappatura delle attivazioni di classe bidirezionale per Vision Transformers che cattura sia i contributi positivi che negativi per migliorare l'interpretabilità, la fedeltà e il rilevamento di esempi adversariali senza necessità di riaddestramento.