GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
Das Team GATech stellt bei der AbjadGenEval-Shared-Task einen Ansatz zur Erkennung von KI-generiertem arabischen Text vor, bei dem ein feinabgestimmter multilingualer E5-large-Encoder mit einfacher Mittelwert-Pooling-Strategie die besten Ergebnisse (F1 0,75) erzielt, da komplexere Pooling-Methoden bei begrenzten Daten nicht besser generalisieren und zudem ein deutlicher Längenunterschied zwischen menschlichen und maschinellen Texten festgestellt wurde.