GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
En la tarea compartida AbjadGenEval, el equipo GATech demostró que el ajuste fino del codificador multilingüe E5-large combinado con un simple promedio de pooling (que alcanzó un F1 de 0.75) superó a estrategias de agrupación más complejas, destacando además que los textos escritos por humanos tienden a ser significativamente más largos que los generados por máquinas.