A Hybrid Vision Transformer Approach for Mathematical Expression Recognition
Deze paper introduceert een hybride Vision Transformer-methode met 2D-positiesche codering en een coverage attention-decoder voor het herkennen van wiskundige expressies, die op de IM2LATEX-100K-dataset een BLEU-score van 89,94 bereikt en daarmee de huidige state-of-the-art-methoden overtreft.