MultiWikiQA: A Reading Comprehension Benchmark in 300+ Languages
Das Paper stellt MultiWikiQA vor, ein Leseverstehens-Benchmark mit über 1,2 Millionen Frage-Antwort-Paaren in 306 Sprachen, der durch LLM-generierte und umformulierte Inhalte aus Wikipedia-Artikeln erstellt wurde und durch menschliche Evaluierung sowie Tests verschiedener Sprachmodelle seine hohe Qualität und Schwierigkeit unter Beweis stellt.