BornoViT: A Novel Efficient Vision Transformer for Bengali Handwritten Basic Characters Classification
本文提出了一种名为 BornoViT 的新型高效轻量级视觉 Transformer 模型,该模型仅含 0.65M 参数,在 BanglaLekha 和自建的 Bornomala 数据集上分别实现了 95.77% 和 91.51% 的准确率,有效解决了孟加拉语手写字符分类中计算成本高和模型体积大的问题。