RetouchIQ: MLLM Agents for Instruction-Based Image Retouching with Generalist Reward

Le papier présente RetouchIQ, un cadre utilisant des agents MLLM guidés par un modèle de récompense généraliste pour transformer les instructions textuelles en actions d'édition d'images exécutables, surmontant ainsi les limites des récompenses basées sur des règles et améliorant la cohérence sémantique et la qualité perceptuelle.

Qiucheng Wu, Jing Shi, Simon Jenni, Kushal Kafle, Tianyu Wang, Shiyu Chang, Handong Zhao

Publié 2026-02-20
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous avez une photo magnifique, mais elle vous semble un peu "plate". Vous voulez lui donner de la vie, la rendre plus dramatique, ou peut-être lui ajouter une touche de nostalgie chaleureuse. C'est là qu'intervient RETOUCHIQ, le nouveau super-héros de la retouche photo décrit dans cet article.

Voici comment cela fonctionne, expliqué simplement avec des images du quotidien :

1. Le Problème : Le Dilemme du Chef Cuisinier

Jusqu'à présent, les ordinateurs étaient excellents pour suivre des recettes précises (comme "ajoute 2 grammes de sel"). Mais la retouche photo, c'est comme la cuisine créative : si vous dites à un chef "rendez ce plat plus réconfortant", il peut le faire de mille façons différentes (plus de beurre, plus de lumière, des épices douces...).

Les anciens systèmes d'intelligence artificielle avaient un gros problème : ils essayaient de comparer votre photo finale à une seule "photo parfaite" de référence. C'est comme si un juge de concours de cuisine disait : "Ce plat n'est pas bon parce qu'il ne ressemble pas exactement à la photo du livre de cuisine". Or, en art, il n'y a pas qu'une seule bonne réponse !

2. La Solution : Le Chef et le Critique Gourmand

L'équipe d'Adobe a créé RETOUCHIQ, qui fonctionne comme un duo d'experts :

  • L'Agent (Le Chef) : C'est un robot très intelligent qui comprend vos mots. Si vous dites "Je veux une ambiance de soirée d'été dorée", il ne se contente pas de deviner. Il réfléchit : "Ah, il faut augmenter la température, baisser un peu les ombres, et ajouter de la saturation". Il agit comme un vrai photographe professionnel qui utilise des logiciels complexes (comme Lightroom) pour appliquer ces réglages précis.
  • Le Récompenseur (Le Critique Gourmand) : C'est la grande innovation. Au lieu de comparer la photo à une référence fixe, ce "critique" est lui-même une intelligence artificielle très sophistiquée. Il regarde votre photo retouchée et vous dit : "Hmmm, c'est bien, mais est-ce que ça correspond vraiment à l'idée de 'soirée d'été' ?". Il invente ses propres critères de jugement à chaque fois (comme la luminosité, l'équilibre des couleurs, l'émotion) et donne une note.

3. L'Entraînement : Apprendre par l'Erreur (et la Récompense)

Comment apprend-on à ce duo ?

  1. L'Observation (Apprentissage Supervisé) : D'abord, on montre au "Chef" des milliers de photos avant/après faites par de vrais humains. Il apprend à imiter leurs gestes.
  2. L'Expérience (Apprentissage par Renforcement) : Ensuite, le "Chef" commence à essayer des choses par lui-même. Il propose une retouche.
    • Le "Critique" regarde le résultat.
    • Si le résultat est cool, le Critique dit : "Bravo !" (Récompense positive).
    • Si le résultat est raté (trop sombre, couleurs bizarres), le Critique dit : "Non, ça ne colle pas à ta demande".
    • Le Chef apprend de cette erreur et essaie une autre combinaison la prochaine fois.

4. Le Secret : Le Critique qui comprend le Chef

Il y a un petit piège : parfois, le "Critique" est entraîné avec des exemples de photos "ratées" qui sont très simples (comme juste baisser la luminosité). Mais le "Chef", lui, fait des retouches complexes et subtiles. Le Critique risque de ne pas comprendre ce que fait le Chef.

Pour résoudre ça, les chercheurs ont inventé une méthode appelée PGRT. C'est comme si le Critique regardait le Chef travailler en direct, avec ses propres méthodes complexes, et apprenait à juger ses travaux spécifiques. Cela permet au Critique de devenir un juge beaucoup plus juste et précis, ce qui aide le Chef à devenir encore meilleur.

En Résumé

RETOUCHIQ est comme un assistant personnel de retouche photo qui :

  1. Comprend vos envies artistiques floues ("rendez ça plus magique").
  2. Agit avec des outils professionnels pour modifier la photo.
  3. S'auto-évalue grâce à un critique intelligent qui lui apprend à faire de mieux en mieux, sans avoir besoin d'une photo de référence parfaite.

C'est un pas de géant pour transformer une simple commande textuelle en une œuvre d'art visuelle, rendant la retouche photo accessible à tous, même sans être un expert en logiciels !

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →