HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection
Il paper "HatePrototypes" propone un metodo efficiente e interpretabile che utilizza rappresentazioni vettoriali di classe derivate da pochi esempi per rilevare e trasferire la capacità di identificare sia l'odio esplicito che quello implicito senza necessità di un continuo ri-addestramento dei modelli.