ScribeTokens: Fixed-Vocabulary Tokenization of Digital Ink
El artículo presenta ScribeTokens, un método de tokenización de tinta digital basado en un vocabulario fijo de 10 símbolos que, combinado con una estrategia de preentrenamiento auto-supervisado, supera a las representaciones vectoriales en tareas de generación y reconocimiento de escritura manuscrita.