Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster
自己教師あり音声モデルの言語カバレッジを 126 言語から 4,017 言語へ拡大することで、地理的接近性や表面的な類型論的類似性を超えて、パプア・オセアニア・オーストラリア諸語を含む太平洋マクロクラスターのような深層的な系統関係や長期的な言語接触の信号を捉えることが可能になることが示されました。