ConLID: Supervised Contrastive Learning for Low-Resource Language Identification
Die Arbeit stellt ConLID vor, eine Methode des überwachten kontrastiven Lernens, die die domänenunabhängige Sprachidentifikation für ressourcenarme Sprachen verbessert und deren Leistung auf Out-of-Domain-Daten um 3,2 Prozentpunkte steigert, ohne die Ergebnisse für ressourcenstarke Sprachen zu beeinträchtigen.