ScribeTokens: Fixed-Vocabulary Tokenization of Digital Ink
Le papier présente ScribeTokens, une méthode de tokenisation à vocabulaire fixe pour l'encre numérique qui, en décomposant le mouvement du stylo en pas de pixels unitaires et en utilisant une prédiction de token auto-supervisée, surpasse les représentations vectorielles existantes tant pour la génération que pour la reconnaissance de texte manuscrit.