GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
In deze paper presenteren de auteurs van GATech hun aanpak voor de AbjadGenEval-taak, waarbij ze vaststellen dat een eenvoudig gemiddelde pooling-methode op een fine-getuned multilinguale E5-large-encoder de beste resultaten boekt voor het detecteren van AI-gegenereerde Arabische tekst, mede door het waarneembare verschil in tekstlengte tussen menselijke en machine-gegenereerde inhoud.