MultiWikiQA: A Reading Comprehension Benchmark in 300+ Languages
O artigo apresenta o MultiWikiQA, um novo benchmark de compreensão de leitura com mais de 1,2 milhão de amostras em 306 idiomas, gerado a partir de artigos da Wikipedia e avaliado quanto à fluidez e dificuldade por humanos e modelos de linguagem.