Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression

Cet article propose un nouveau modèle de caméra intégrant un paramètre de rétrécissement pour simuler les effets de perspective dans la régression de modèles morphables 3D, permettant ainsi d'améliorer le recalage de visages en gros plan, notamment ceux capturés par des caméras montées sur la tête, tout en conservant la stabilité des approches orthographiques traditionnelles.

Toby Chong, Ryota Nakajima

Publié 2026-03-06
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

📸 Le Secret du "Gros Plan" : Comment réparer les visages déformés en 3D

Imaginez que vous essayez de sculpter un visage en argile (un modèle 3D) en regardant simplement une photo. C'est ce que font les ordinateurs quand ils essaient de transformer une photo de vous en un personnage 3D.

Jusqu'à présent, les artistes numériques utilisaient une règle très simple : "Tout est plat". Ils supposaient que la caméra était si loin que le nez ne semblait pas plus gros que les oreilles. C'est comme regarder un dessin animé en 2D : tout est à la même distance de vous.

Le problème ?
Quand vous prenez un selfie ou que vous portez une caméra sur votre tête (comme dans un casque de réalité virtuelle), la caméra est tout près. En vrai, quand on est tout près d'un objet, le nez semble énorme et les oreilles semblent petites. C'est la perspective.

Les anciennes méthodes de création 3D ignoraient cette règle. Résultat ? Quand elles essayaient de recréer un visage en gros plan, elles faisaient des erreurs bizarres :

  • Le nez devenait tout petit (comme un bouton de nez).
  • Le visage semblait flotter dans le vide.
  • Le haut de la tête semblait s'élargir étrangement (les auteurs appellent cela l'effet "cerveau qui gonfle").

💡 La Solution : Un "Régulateur de Profondeur"

Toby Chong et Ryota Nakajima (de la célèbre société d'animation Toei, connue pour Dragon Ball et One Piece) ont eu une idée brillante. Au lieu de tout réécrire, ils ont ajouté un petit bouton magique à la méthode existante.

Ils appellent ce bouton le paramètre de rétrécissement (ou shrinkage parameter ρ\rho).

L'analogie du Zoom :
Imaginez que vous avez un vieux projecteur de diapositives (la méthode ancienne) qui projette toujours l'image à la même taille, peu importe la distance.

  • L'ancienne méthode : Elle dit "Le nez est petit, donc je le dessine petit".
  • La nouvelle méthode : Elle ajoute un petit levier. Si la caméra est très proche, le levier dit : "Attends, le nez est tout près, il doit paraître plus gros !".

Ce levier permet au modèle 3D de comprendre la différence entre "être loin" et "avoir un objectif grand angle". Il apprend à déformer le visage de la bonne manière pour qu'il corresponde à la photo, même en gros plan.

🛠️ Comment ça marche en pratique ?

  1. C'est compatible : Ils n'ont pas cassé les vieux modèles. Ils ont juste ajouté ce petit bouton à côté. C'est comme ajouter un turbo à une voiture qui roule déjà bien.
  2. L'entraînement : Ils ont pris des milliers de photos prises par des caméras fixées sur la tête d'acteurs (très proches du visage) pour apprendre à ce bouton quand il faut l'activer.
  3. Le résultat :
    • Sur les selfies et les images de caméras de casque : Le nez est maintenant de la bonne taille, le visage est réaliste, plus de "cerveau gonflé".
    • Sur les photos normales (prises de loin) : Ça ne change presque rien, le modèle fonctionne toujours aussi bien.

🎭 Pourquoi c'est important ?

Aujourd'hui, on veut créer des personnages 3D pour les jeux vidéo, les filtres TikTok ou les films d'animation en temps réel. Souvent, ces personnages sont filmés de très près.

Sans cette nouvelle méthode, si un acteur fait une grimace de très près, son avatar 3D aura l'air d'un alien avec un nez minuscule. Avec cette méthode, l'avatar garde ses proportions naturelles, même quand il est tout près de la caméra.

En résumé :
Les chercheurs ont découvert que les ordinateurs étaient trop "paresseux" pour comprendre la perspective en gros plan. Ils ont donc ajouté un petit "aide-mémoire" mathématique qui dit : "Quand c'est tout près, le nez doit paraître plus gros !". C'est simple, mais ça change tout pour le réalisme des visages 3D.