SlovKE: A Large-Scale Dataset and LLM Evaluation for Slovak Keyphrase Extraction
Dit artikel introduceert SlovKE, een groot dataset van 227.432 wetenschappelijke abstracts met auteur-toegewezen sleutelwoorden voor het Slowaaks, en toont aan dat LLM-gebaseerde extractie (KeyLLM) statistische methoden overtreft door de uitdaging van morfologische variatie in deze taalkundig rijke taal beter aan te pakken.