Restoration-Guided Kuzushiji Character Recognition Framework under Seal Interference

Este artigo propõe a RG-KCR, uma estrutura de três etapas que combina detecção, restauração de imagem para remover interferências de selos e classificação para melhorar a precisão do reconhecimento de caracteres Kuzushiji em documentos históricos japoneses.

Rui-Yang Ju, Kohei Yamashita, Hirotaka Kameko, Shinsuke Mori

Publicado 2026-02-24
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você encontrou um diário antigo escrito por um samurai no Japão do século 18. A caligrafia é linda, mas é uma versão "cursiva" e muito diferente do japonês que as pessoas usam hoje. Além disso, o papel está cheio de carimbos vermelhos (selos) que os donos anteriores colocaram para provar que o livro era deles.

O problema? Esses carimbos vermelhos cobrem as letras, tornando impossível para qualquer pessoa (ou até para computadores modernos) ler o que está escrito. É como tentar ler uma carta onde alguém jogou tinta vermelha por cima das palavras.

Este artigo apresenta uma solução inteligente chamada RG-KCR. Pense nela como um "tripé de mágicos" que trabalha em três etapas para limpar e ler esse documento antigo.

Aqui está como funciona, passo a passo:

1. O Detetive (Detecção)

Primeiro, o sistema precisa saber onde estão as letras, mesmo que estejam sujas ou cobertas.

  • A Analogia: Imagine um detetive usando óculos de raio-X. Ele não tenta ler o texto ainda; ele apenas aponta o dedo e diz: "Olha, tem uma letra aqui, e outra ali".
  • A Tecnologia: Eles usam um modelo de inteligência artificial chamado YOLOv12 (que é como um super-detetive rápido). Ele desenha caixas ao redor de cada caractere japonês antigo, mesmo que um carimbo vermelho esteja em cima dele.

2. O Restaurador (Limpeza)

Agora que sabemos onde estão as letras, precisamos tirar o carimbo vermelho de cima delas sem rasgar o papel.

  • A Analogia: Pense em um pintor talentoso que sabe exatamente qual é a cor "vermelho carimbo". Ele pega uma escova mágica que remove apenas o vermelho, mas deixa o preto da tinta da escrita intacto. Depois, ele "pinta" o buraco que ficou com a textura do papel antigo, como se o carimbo nunca tivesse existido.
  • O Truque: O sistema é muito esperto. Ele sabe que os carimbos são vermelhos e brilhantes. Ele usa uma regra simples: "Se o vermelho for muito forte e o verde/azul forem fracos, é um carimbo". Ele remove essa área e usa um algoritmo para preencher o espaço com o que provavelmente estava lá (o traço da letra), sem precisar "aprender" com milhares de exemplos (o que economiza tempo e computador).

3. O Leitor (Classificação)

Com a imagem limpa e as letras visíveis novamente, o sistema finalmente lê o texto.

  • A Analogia: Agora que o papel está limpo, um especialista em caligrafia (uma IA chamada Metom) olha para cada letra individualmente e diz: "Ah, isso aqui é o caractere 'A', e aquilo é o 'B'".
  • O Resultado: O sistema pega essas letras antigas e as substitui visualmente por letras japonesas modernas, sobrepondo-as na imagem original.

Por que isso é importante?

Antes desse método, os computadores ficavam confusos quando viam um carimbo vermelho. Eles tentavam ler o carimbo como se fosse uma letra, ou ficavam cegos na área manchada.

Os autores testaram seu sistema e descobriram que:

  1. O Detetive acerta 98% das vezes onde estão as letras.
  2. O Restaurador limpa a imagem tão bem que a qualidade visual é quase perfeita.
  3. O Leitor, após a limpeza, acerta a leitura das letras em 95,33% dos casos (um aumento enorme comparado a tentar ler sem limpar primeiro).

O Resumo da Ópera

Imagine que você tem uma foto de família antiga onde alguém escreveu uma mensagem no verso, mas um carimbo de correio vermelho cobriu metade da mensagem.

  • Sem o RG-KCR: Você tenta adivinhar o que está escrito, mas erra muito.
  • Com o RG-KCR: Um robô encontra a mensagem, apaga digitalmente o carimbo vermelho, preenche o buraco com a tinta original e te mostra a mensagem escrita em letras claras e modernas.

O objetivo final é permitir que qualquer pessoa japonesa (ou interessada) possa ler documentos históricos que estavam trancados no passado, apenas porque estavam cobertos por carimbos de donos antigos. É como dar óculos novos para a história.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →