Open Korean Historical Corpus: A Millennia-Scale Diachronic Collection of Public Domain Texts
Este trabalho apresenta o Open Korean Historical Corpus, um conjunto de dados de domínio público e de grande escala que abrange 1.300 anos de evolução linguística coreana, permitindo análises quantitativas de mudanças diacrônicas e servindo como recurso para o pré-treinamento de modelos de linguagem.