GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
Il paper presenta l'approccio di GATech alla sfida AbjadGenEval per il rilevamento di testi arabi generati dall'IA, dimostrando che un semplice pooling medio su un encoder multilingue E5-large, unito all'osservazione che i testi umani sono significativamente più lunghi di quelli generati, ha ottenuto prestazioni superiori rispetto a strategie di pooling più complesse.