Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection

Cet article présente une méthode de détection de copie d'images améliorée par l'intégration d'un module de suivi de coordonnées pixeliques (PixTrace) et d'une fonction de perte contrastive guidée par la géométrie (CopyNCE), permettant d'atteindre des performances de pointe et une meilleure interprétabilité en apprenant des correspondances fines entre les patches.

Yichen Lu, Siwei Nie, Minlong Lu, Xudong Yang, Xiaobo Zhang, Peng Zhang

Publié 2026-02-26
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous êtes un détective privé spécialisé dans la détection de faux. Votre travail consiste à savoir si une photo que vous voyez est une copie modifiée d'une photo originale, même si quelqu'un a changé les couleurs, recadré l'image, ou ajouté des filtres.

Le problème, c'est que les méthodes actuelles sont un peu comme des détectives qui regardent la photo de loin. Ils disent : « Tiens, cette photo ressemble à celle-là ! » Mais si la copie a été très bien trafiquée (par exemple, un chat a été découpé et collé sur un autre fond), les détectives classiques se trompent souvent car ils ne voient pas les détails fins.

Voici comment les auteurs de cette recherche (de chez Ant Group) ont créé un nouveau super-détective, qu'ils appellent PixTrace et CopyNCE.

1. Le Problème : La "Piste" a été effacée

Quand on copie une image et qu'on la modifie, on perd souvent le lien entre le pixel original et le pixel modifié.

  • L'analogie : Imaginez que vous avez un puzzle. Quelqu'un prend une pièce du puzzle, la peint en rouge, la tourne, et la remet à un endroit différent. Un détective classique regarde le puzzle fini et dit : « Cette pièce rouge ne correspond à rien de connu ». Il ne sait pas que cette pièce vient de l'endroit où il y avait un ciel bleu avant.

2. La Solution Magique : PixTrace (Le GPS des pixels)

Les chercheurs ont inventé un outil appelé PixTrace.

  • L'analogie : Imaginez que chaque pixel de l'image originale a un GPS ou un téléphone portable intégré.
  • Quand vous appliquez une modification (comme tourner l'image ou changer la couleur), au lieu de simplement déplacer le pixel, vous mettez à jour son GPS.
  • PixTrace est comme un grand carnet de notes qui suit chaque pixel. Il sait exactement : « Ce pixel rouge dans la nouvelle image vient du pixel bleu de la vieille image, qui était à telle position ».
  • Même si l'image est découpée (matting) ou déformée, ce carnet garde la trace du chemin parcouru par chaque pixel.

3. L'Entraînement : CopyNCE (Le Professeur exigeant)

Une fois qu'ils ont ce carnet de notes (PixTrace), ils l'utilisent pour entraîner une intelligence artificielle (le modèle) avec une nouvelle méthode appelée CopyNCE.

  • L'analogie : Imaginez un professeur qui entraîne un élève à reconnaître des jumeaux.
    • L'ancienne méthode : Le professeur montrait deux photos et disait : « Regarde, elles se ressemblent ». Mais parfois, il se trompait en montrant des photos qui ne se ressemblaient pas vraiment (du bruit).
    • La nouvelle méthode (CopyNCE) : Grâce au carnet de notes (PixTrace), le professeur peut dire : « Regarde ce petit carré de l'image A. Il correspond exactement à ce petit carré de l'image B, et il couvre 40% de la surface. Apprends à faire le lien entre ces deux carrés précis ».
  • Cela force l'IA à ne pas seulement regarder l'image globale, mais à comprendre comment les petits morceaux (les "patches") s'assemblent. C'est comme apprendre à un enfant à reconnaître un visage non pas par la couleur de la peau, mais en sachant que l'œil gauche est toujours à côté du nez, même si le visage est tourné.

4. Les Résultats : Pourquoi c'est génial ?

Grâce à cette combinaison (le GPS des pixels + le professeur exigeant), leur système est devenu le meilleur du monde sur les tests officiels (DISC21).

  • Performance : Il trouve les copies même quand elles sont très modifiées, là où les autres systèmes échouent.
  • Compréhension : Ce qui est le plus cool, c'est que le système devient "transparent". Si vous lui demandez « Pourquoi penses-tu que c'est une copie ? », il peut vous montrer exactement quels morceaux de l'image ont été copiés et collés. C'est comme si le détective vous montrait la preuve physique au lieu de juste dire "Je le sens".

En résumé

Cette recherche a résolu un problème complexe en disant : « Ne devine pas si c'est une copie, suis la trace des pixels ! »

Au lieu de laisser l'IA deviner au hasard, ils lui donnent une carte précise du voyage que chaque pixel a fait. Cela permet de détecter des copies très sophistiquées que les humains et les autres ordinateurs ne verraient pas. C'est un peu comme passer d'un détective qui regarde une photo floue à un détective qui a des lunettes de vision nocturne et un plan détaillé du crime.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →