Restoration-Guided Kuzushiji Character Recognition Framework under Seal Interference

本文提出了一种名为 RG-KCR 的三阶段框架,通过引入印章干扰修复机制,有效解决了现代日本古文书(Kuzushiji)识别中因印章重叠导致的识别准确率下降问题。

Rui-Yang Ju, Kohei Yamashita, Hirotaka Kameko, Shinsuke Mori

发布于 2026-02-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

想象一下,你手里拿着一本几百年前的日本古书。书里的字写得非常潦草、连笔,就像现代人的“狂草”书法,普通人根本看不懂。更糟糕的是,书页上盖满了红色的印章(就像我们现在的公章或私章),这些印章不仅颜色鲜艳,还经常直接盖在文字上面,把字都遮住了。

这就好比你想读一份古老的食谱,但上面被泼了红色的果酱,还盖了好几个大印章,字都看不清了。

这篇论文就是为了解决这个“读古书难”的问题,提出了一套**“三步走”的智能修复与识别方案**。我们可以把它想象成一个**“古籍侦探社”**的工作流程:

第一步:精准定位(给每个字画个框)

任务: 在满是污渍和印章的纸上,把每一个字都找出来。
比喻: 就像在拥挤的人群中,你要把每一个特定的人(古文字)都圈出来。
做法: 作者使用了一种叫 YOLOv12 的超级 AI 眼睛。它非常厉害,哪怕字被红色的印章盖住了一半,它也能精准地画出一个个小方框,把字“圈”住。

  • 成果: 它的准确率高达 98%,几乎不会漏掉任何一个字,也不会把纸上的污渍误认为是字。

第二步:魔法去污(把红印章“擦”掉)

任务: 把盖在字上面的红色印章去掉,让字露出来,但又不破坏字本身。
比喻: 这就像是一个**“数字橡皮擦”**。普通的橡皮擦可能会把纸擦破,但这个 AI 橡皮擦很聪明:

  1. 它知道印章是红色的(因为印章通常是红色的)。
  2. 它只擦掉红色的部分。
  3. 擦掉后,它会根据周围文字的纹理,像**“智能填色”**一样,把被印章盖住的字迹“补”回来。
    特点: 这个过程不需要重新训练复杂的模型,速度快,而且专门针对红色印章设计,非常高效。

第三步:认字翻译(把古字变现代字)

任务: 认出被“擦”干净的字到底是什么,并把它变成现代人能看懂的字。
比喻: 就像请了一位**“古文字翻译官”**。
做法: 把第一步圈出来的字,经过第二步“清洗”后,交给一个叫 Metom 的超级翻译 AI。这个 AI 见过超过一百万种不同的古字写法。

  • 成果: 经过“清洗”后,这个翻译官的准确率从 93.45% 提升到了 95.33%。也就是说,原本因为印章遮挡而认错的字,现在大部分都能认对了。

最终效果:古今对话

最后,系统会把识别出来的现代日语汉字,直接“贴”回古书的对应位置(就像给古书加了现代字幕)。

  • 以前: 你看着满纸红印和潦草古字,一头雾水。
  • 现在: 你看着古书,上面浮现出清晰的现代汉字,瞬间就能读懂几百年前的故事了。

为什么这个工作很重要?

以前的 AI 系统,一旦遇到红印章盖住字,就会“晕头转向”,认不出字。这篇论文就像给 AI 戴上了一副**“去红滤镜”的眼镜**,先帮它把干扰物(印章)清理掉,再让它去认字。

总结来说:
这就好比你要读一封被红墨水泼过的古代情书。

  1. 第一步:先找到信里每一个字的位置。
  2. 第二步:用魔法把红墨水洗掉,把被盖住的字迹复原。
  3. 第三步:把复原后的古字翻译成现代文,让你能读懂这份跨越时空的爱意。

这套方法不仅让古书变得可读,还让普通人也能轻松享受阅读历史文献的乐趣,不再需要专门请专家来翻译了。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →