Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

Este artigo propõe uma estrutura de duas etapas que combina aprendizado contrastivo supervisionado em alfabetos inventados com destilação de conhecimento para aprendizado auto-supervisionado em scripts históricos, permitindo a extração de representações de glifos que capturam tanto distinções claras quanto similaridades evolutivas latentes sem depender de relações de ground-truth.

Claire Roman, Philippe Meyer

Publicado 2026-03-09
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando resolver um mistério antigo: como diferentes sistemas de escrita do mundo estão relacionados? Será que o alfabeto grego e o latino são "primos"? O chinês e o japonês têm uma "família" em comum?

O problema é que, ao contrário de alfabetos inventados (como os de filmes de ficção), onde sabemos exatamente quem é quem, na história real as coisas são confusas. Não temos um "livro de respostas" confiável que diga quem é parente de quem. Se tentarmos ensinar um computador a aprender essas relações usando regras rígidas, ele pode cometer erros graves, assumindo coisas que os historiadores nem mesmo concordam.

Este artigo propõe uma solução inteligente, como se fosse um sistema de aprendizado em duas etapas, usando uma metáfora de mestre e aprendiz.

A Metáfora: O Mestre Rigoroso e o Aprendiz Curioso

O método funciona como se estivéssemos treinando um jovem historiador (o "Aprendiz") para estudar escritas antigas.

Etapa 1: O Treinamento do Mestre (O "Mundo Falso")

Primeiro, criamos um Mestre (um modelo de computador) treinado em um ambiente seguro e perfeito: alfabetos inventados.

  • A Analogia: Imagine que estamos ensinando o Mestre a distinguir letras de um alfabeto alienígena ou de um livro de fantasia. Aqui, sabemos com 100% de certeza que o "A" é diferente do "B". Não há dúvidas.
  • O Resultado: O Mestre aprende a ser um especialista em diferenças. Ele fica muito bom em dizer: "Isso é um desenho, aquilo é outro desenho, eles são totalmente diferentes". Ele cria uma "régua" mental muito precisa para separar coisas que não têm nada a ver.

Etapa 2: O Aprendiz e a História Real (O "Mundo Verdadeiro")

Agora, trazemos o Aprendiz para estudar as escritas reais da história (grego, latim, chinês, etc.), onde as regras são confusas.

  • O Problema: Se usássemos apenas o método tradicional, teríamos que dizer ao computador: "O grego e o latim são diferentes, o chinês é diferente de ambos". Mas e se o grego e o latim tiverem uma origem comum que não sabemos? O computador ficaria confuso.
  • A Solução (Distilação): Em vez de ensinar o Aprendiz do zero, nós copiamos a experiência do Mestre para ele. O Aprendiz começa com a "mente" do Mestre.
  • A Mágica: O Aprendiz olha para as escritas antigas e diz: "Ok, Mestre, eu sei que devo separar coisas muito diferentes. Mas, nessas escritas antigas, vou deixar que as semelhanças naturais apareçam sozinhas".
    • O Aprendiz é livre para descobrir que, talvez, duas escritas pareçam mais próximas do que o Mestre imaginava, porque elas compartilham traços históricos reais que o Mestre (treinado em ficção) não conhecia.
    • O Aprendiz não é forçado a criar "inimigos" (pares negativos) entre escritas que podem ser parentes. Ele apenas aprende a ser flexível, mantendo a disciplina do Mestre, mas adaptando-se à realidade.

O Resultado: Um Mapa Melhor

Ao final desse processo, o computador cria um mapa mental das escritas:

  1. No nível das letras: Ele continua sendo ótimo em dizer "esta letra é igual àquela" (reconhecimento de caracteres), mesmo com poucas amostras.
  2. No nível das escritas: O mapa fica mais inteligente. Escritas que realmente têm uma história em comum (como grego e latino) aparecem mais próximas no mapa do que escritas que não têm nada a ver (como chinês e latino).

Por que isso é importante?

É como se, em vez de forçar uma árvore genealógica que pode estar errada, nós deixássemos o computador "sentir" a semelhança entre as escritas, guiado por um especialista que sabe o que é "diferente", mas que deixa o computador descobrir o que é "parecido" na vida real.

Em resumo:

  • Problema: Não sabemos com certeza a história de todas as escritas antigas.
  • Solução: Treinamos um "Mestre" em coisas que sabemos (alfabetos inventados) para aprender a separar o que é diferente. Depois, usamos esse Mestre para guiar um "Aprendiz" a estudar as coisas reais, permitindo que ele descubra as conexões históricas sem ser forçado a fazer suposições erradas.
  • Conclusão: O resultado é um sistema que entende tanto a letra quanto a história por trás dela, criando um mapa de conexões humanas muito mais preciso e fiel à realidade.