Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

Cet article propose un cadre en deux étapes pour l'apprentissage de similarités entre écritures, combinant un apprentissage contrastif supervisé sur des alphabets inventés et une distillation non supervisée vers des scripts historiques afin de découvrir des similarités latentes sans dépendre de relations évolutives certifiées.

Claire Roman, Philippe Meyer

Publié 2026-03-09
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous essayez de comprendre comment les différentes écritures du monde sont liées entre elles, un peu comme un généalogiste qui tente de reconstruire l'arbre familial de toutes les langues. Le problème, c'est que l'histoire est floue : on sait que le grec et le latin sont cousins, mais on ne sait pas toujours avec certitude si deux symboles anciens viennent de la même source ou s'ils se ressemblent juste par hasard.

C'est là que cette recherche intervient. Les auteurs proposent une méthode en deux étapes pour apprendre à une intelligence artificielle à comparer ces écritures sans se tromper sur l'histoire.

Voici l'explication simple, avec quelques images pour mieux comprendre :

1. Le Problème : La "Maison des Fantômes" vs. La "Maison des Réels"

Pour entraîner une IA à reconnaître des lettres, on a besoin de lui montrer des exemples.

  • Le problème : Si on lui montre des alphabets inventés (comme ceux des films de science-fiction ou les écritures de Tolkien), on est sûr à 100 % que le "A" de l'alien 1 n'a rien à voir avec le "A" de l'alien 2. C'est facile à apprendre.
  • La difficulté : Avec les vraies écritures anciennes (comme les hiéroglyphes ou les runes), on ne sait pas toujours si deux signes sont liés ou non. Si on force l'IA à dire "Ces deux signes sont différents" alors qu'ils pourraient être cousins, on lui donne de mauvaises informations. C'est comme essayer de faire un arbre généalogique en inventant des liens qui n'existent pas.

2. La Solution : L'École en Deux Temps

Les chercheurs ont créé un système qui ressemble à un professeur et son élève.

Étape 1 : L'Entraînement du Professeur (Sur des alphabets inventés)

Imaginez un professeur très strict qui travaille dans une école où tout est clair.

  • Il utilise des alphabets inventés (comme des dessins de monstres ou des signes de jeux vidéo).
  • Ici, il n'y a aucun doute : le signe A est différent du signe B.
  • Le professeur apprend à distinguer parfaitement chaque forme. Il devient un expert en reconnaissance de formes, capable de dire "Ceci est un A, cela est un B" sans se tromper.
  • L'analogie : C'est comme un entraîneur de sport qui fait faire des exercices de base sur un terrain parfaitement plat et marqué. L'athlète apprend la technique pure.

Étape 2 : L'Apprentissage de l'Élève (Sur les vraies écritures anciennes)

Maintenant, on envoie cet élève sur le terrain de la réalité, où le sol est boueux et les règles floues (les vraies écritures historiques).

  • L'élève ne reçoit pas de corrections directes sur l'histoire (on ne lui dit pas "ce signe vient de là").
  • À la place, il observe le professeur. Le professeur lui montre : "Regarde, ces deux formes se ressemblent beaucoup."
  • L'élève utilise cette intuition pour organiser les écritures anciennes. Il apprend à dire : "Ces deux écritures semblent proches, même si on ne connaît pas leur histoire exacte."
  • L'analogie : C'est comme si l'élève apprenait à danser. D'abord, il apprend les pas de base avec un professeur sur un parquet lisse (Étape 1). Ensuite, il va danser en soirée avec des inconnus (Étape 2). Il n'a pas de partitions, mais il utilise ce qu'il a appris pour s'adapter, sentir la musique et trouver des partenaires qui bougent comme lui, sans avoir besoin de connaître leur nom.

3. Le Résultat : Une Carte Géographique Intelligente

Grâce à cette méthode, l'IA crée une "carte" mentale des écritures :

  • Les écritures qui se ressemblent vraiment (comme le grec et le cyrillique) se retrouvent proches sur la carte.
  • Les écritures totalement différentes (comme le latin et le chinois) se retrouvent loin.
  • Surtout, l'IA n'a pas besoin de connaître l'histoire exacte pour faire cette carte. Elle a juste appris à "sentir" les ressemblances visuelles.

Pourquoi c'est génial ?

C'est comme si on donnait à un explorateur une boussole très précise (le professeur) pour naviguer dans une forêt inconnue (les écritures anciennes). Même s'il ne connaît pas le nom de chaque arbre, il sait où aller parce qu'il a appris à reconnaître les sentiers.

En résumé, cette méthode permet de découvrir des liens historiques entre des écritures anciennes sans avoir besoin de livres d'histoire parfaits, en utilisant d'abord des exercices simples pour apprendre la logique, puis en appliquant cette logique aux cas complexes. C'est une façon intelligente de contourner le manque de certitudes historiques.