CzechTopic: A Benchmark for Zero-Shot Topic Localization in Historical Czech Documents
Este artigo apresenta o "CzechTopic", um benchmark com documentos históricos tchecos anotados por humanos para avaliar a localização de tópicos, demonstrando que, embora os grandes modelos de linguagem variem significativamente em desempenho, modelos menores baseados em BERT e fine-tuned permanecem competitivos.