Applied Explainability for Large Language Models: A Comparative Study
Deze paper presenteert een toegepast vergelijkend onderzoek naar drie uitlegbaarheidstechnieken voor een DistilBERT-model, waarbij wordt geconcludeerd dat gradient-gebaseerde methoden stabielere inzichten bieden dan attention- of model-agnostische benaderingen, die echter respectievelijk minder nauwkeurig of rekenkundig duurder zijn.