What Triggers my Model? Contrastive Explanations Inform Gender Choices by Translation Models
Diese Studie untersucht mittels kontrastiver Erklärungen und Saliency-Zuordnung, welche Eingabetokens in englischen Quelltexten die Geschlechterentscheidungen von neuronalen Übersetzungsmodellen in deutsche und spanische Zieltexte auslösen, und zeigt dabei eine deutliche Übereinstimmung zwischen den Modellattributen und menschlichen Geschlechterwahrnehmungen auf.