Restoration-Guided Kuzushiji Character Recognition Framework under Seal Interference

本研究は、文書に頻繁に存在する判の重なりによる認識精度の低下を解決するため、文字検出、判の除去による画像修復、文字分類の 3 段階からなる「修復ガイド型古書体文字認識フレームワーク(RG-KCR)」を提案し、その有効性を実証したものである。

Rui-Yang Ju, Kohei Yamashita, Hirotaka Kameko, Shinsuke Mori

公開日 2026-02-24
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、「古くて読みにくい日本の手書き文書(くずし字)を、AI が正しく読めるようにする新しい方法」について書かれたものです。特に、文書に押された「赤い印鑑(朱印)」が文字を隠してしまい、AI が読み間違える問題を解決する画期的なアプローチが紹介されています。

まるで**「傷ついた古文書を修復する職人」「超能力を持つ翻訳者」**がチームを組んで、現代人が読めるようにする物語のような技術です。

以下に、3 つのステップに分けて、わかりやすく解説します。


📜 背景:なぜこれが難しいの?

昔の日本(明治時代以前)の文書には、**「くずし字」という、現代の文字とは全く違う、くねくねと流れるような文字が使われていました。
さらに、その文書には
「赤い印鑑」が所々に押されています。これは所有権を示すものですが、「文字の上に乗っかっている」**ことが多く、AI が「これは何の文字だ?」と判断するのを邪魔します。

現在の AI は、きれいな文字なら読めますが、**「赤いインクで文字が隠れている状態」になると、途端にバカになってしまいます。まるで、「黒板に赤いチョークで落書きがされて、元の文字が見えなくなっている状態」**を想像してください。


🛠️ 解決策:3 段階の「魔法のフレームワーク」

この研究では、**「RG-KCR(修復ガイド付きくずし字認識)」**という 3 つのステップからなるシステムを提案しています。

第 1 段階:🔍「どこに文字があるか」を見つける探偵

まず、AI に「文書の中から、文字が入っている場所(枠)」を探させます。

  • どんな技術? 「YOLOv12」という最新の物体検出 AI を使っています。
  • どんな感じ? 赤い印鑑が乗っていても、「あ、ここには文字があるぞ!」と正確に枠を引くことができます。まるで、**「煙(印鑑)の向こう側にある宝物(文字)の位置を、探偵が正確に特定する」**ようなものです。

第 2 段階:🎨「赤いインクを消して、文字を復元する」魔法のブラシ

ここがこの論文の一番の目玉です。

  • どんな技術? 「学習不要の修復アルゴリズム」です。

  • どんな感じ?

    1. AI は「赤い色」だけを狙い撃ちします(文字は黒や茶色なので、赤い部分だけを特定できます)。
    2. 赤い印鑑の部分を「消しゴム」で消します。
    3. 消えた部分の隙間を、周りの文字の雰囲気や紙の質感に合わせて**「塗りつぶし(インペインティング)」**で埋め直します。

    これは、**「傷ついた絵画の修復職人が、赤い落書きだけを丁寧に剥がし、元の絵を再現する」**作業に似ています。特別な AI を訓練する必要がなく、計算も軽いので、スマホでもサクサク動きます。

第 3 段階:📖「修復された文字を翻訳する」翻訳者

最後に、修復された文字を AI が読み取ります。

  • どんな技術? 「Metom」という、100 万種類以上の文字を覚えている超高性能な AI 翻訳者です。
  • どんな感じ? 第 2 段階で「赤いインクを消してきれいにした文字」を渡すので、AI は迷わず「これは『尚』、『書』、『堂』だ!」と正しく読み取れます。

🌟 結果:どれくらいすごい?

実験の結果、この 3 段階のシステムは驚くほど成功しました。

  • 印鑑が乗っていても、文字の位置を 98% の確率で見つけられる。
  • 赤いインクを消すことで、AI の読み取り精度が 93.4% から 95.3% に向上した。
    • 一見すると 2% の差に見えるかもしれませんが、AI の世界では**「大きな差」です。これは、「少しの補正で、失敗していたテストが合格ラインを超えた」**ような効果です。

🎁 最終的な出力

システムは、元の古文書の上に、**「読み取れた現代の日本語文字」を、元の位置に重ねて表示してくれます。
まるで、
「古文書の上に、透明なシートを被せて、現代語で書き写したような状態」**で、誰でも直感的に文書の内容が読めるようになります。

💡 まとめ

この研究は、**「赤い印鑑という邪魔なものを、AI が『消して』から『読む』」**という、シンプルながら非常に効果的なアイデアで、古くから残る日本の文化財を現代人が楽しめるようにしました。

**「傷ついた古文書を、職人が丁寧に修復し、翻訳者がその内容を解き明かす」**という、技術と伝統の美しいコラボレーションと言えます。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →