BeautyGRPO: Aesthetic Alignment for Face Retouching via Dynamic Path Guidance and Fine-Grained Preference Modeling

이 논문은 기존 방법들의 한계를 극복하고 인간의 미적 선호도와 높은 충실도를 동시에 달성하기 위해, 정교한 선호도 데이터셋과 reward 모델을 구축하고 확률적 드리프트를 보정하는 동적 경로 안내 (DPG) 기법을 도입한 얼굴 보정 강화학습 프레임워크 'BeautyGRPO'를 제안합니다.

Jiachen Yang, Xianhui Lin, Yi Dong, Zebiao Zheng, Xing Liu, Hong Gu, Yanmei Fang

게시일 2026-03-03
📖 2 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

BeautyGRPO: 얼굴 보정 (리터칭) 의 새로운 기준, '자연스러운 아름다움'을 찾아서

이 논문은 **"얼굴을 예쁘게 다듬되, 내 얼굴은 그대로 유지하는 것"**이라는 아주 까다로운 문제를 해결한 새로운 기술, BeautyGRPO를 소개합니다.

기존의 얼굴 보정 기술들은 두 가지 큰 고민거리가 있었습니다.

  1. 너무 딱딱함: 컴퓨터가 정해진 대로만 고쳐서 피부가 마치 플라스틱 인형처럼 매끄럽고 비현실적으로 보임.
  2. 너무 지저분함: AI 가 임의로 고치다 보니 잡티는 지워졌는데, 얼굴에 이상한 노이즈 (소음) 가 생기거나 얼굴 생김새가 뭉개짐.

이 논문은 이 두 문제를 해결하기 위해 세 가지 핵심 아이디어를 제시합니다.


1. "미용사 선생님"을 훈련시켰다 (FRPref-10K 데이터셋)

기존 AI 는 단순히 "원본 사진과 똑같이 찍힌 사진"을 목표로 학습했습니다. 하지만 사람은 "원본과 똑같지 않아도, 더 예쁘고 자연스러우면" 만족합니다.

  • 비유: 기존 AI 는 복사기처럼 원본을 그대로 복사하려 했지만, 우리는 명품 미용사처럼 "어떤 점이 예쁜지, 어떤 점이 자연스러운지"를 아는 AI 가 필요합니다.
  • 해결책: 연구진은 1 만 장이 넘는 얼굴 사진으로 **'미용사 선생님 (보상 모델)'**을 훈련시켰습니다. 이 선생님은 피부 결, 잡티 제거, 여드름 제거, 얼굴 특징 (점, 주름 등) 보존 등 5 가지 기준을 아주 세밀하게 평가할 수 있습니다.

2. "나침반"을 든 탐험가 (Dynamic Path Guidance, DPG)

AI 가 새로운 보정 방법을 찾아나설 때 (탐험), 너무 자유롭게 돌아다니다가 길을 잃고 엉뚱한 곳 (노이즈가 많은 이상한 얼굴) 으로 갈 수 있습니다.

  • 비유: AI 를 등산하는 탐험가라고 상상해 보세요.
    • 기존 방법 (FlowGRPO): 등산가가 "아무 데나 가보자!"라고 하며 산을 뛰어다닙니다. (탐색은 잘되지만, 절벽으로 떨어지거나 엉뚱한 길로 빠질 위험이 큽니다.)
    • 새로운 방법 (BeautyGRPO): 등산가에게 **나침반 (Anchor)**을 줍니다. 나침반은 "이쪽이 안전한 정상 (자연스러운 얼굴) 이야"라고 방향을 잡아줍니다.
    • 핵심: 탐험가는 나침반의 방향을 보며 안전하게 새로운 길을 찾아다닙니다. 너무 멀리 벗어나지 않으면서도, 나침반이 가리키는 방향보다 더 좋은 곳 (더 예쁜 얼굴) 을 발견하면 그곳으로 이동합니다. 이를 **동적 경로 안내 (DPG)**라고 합니다.

3. "사람의 눈"을 가장 잘 따라가는 AI

이 기술은 단순히 "잡티를 지우는 것"이 아니라, **"사람이 보기엔 얼마나 자연스러운가?"**를 최우선으로 합니다.

  • 결과:
    • 피부: 잡티는 깔끔하게 지우되, 피부의 자연스러운 결 (기름기, 모공) 은 살려서 인형처럼 보이지 않음.
    • 얼굴 특징: 점 (미인점), 수염, 주름 등 개성을 가진 특징은 지우지 않고 유지함.
    • 선명도: 얼굴이 흐릿하거나 AI 가 만든 듯한 인공적인 흔적이 없음.

📝 한 줄 요약

"BeautyGRPO 는 AI 가 얼굴을 고칠 때, '나침반'을 들고 '미용사 선생님'의 눈을 따라가며, 인형처럼 매끄럽지 않으면서도 잡티는 깨끗이 지워진, 가장 자연스러운 얼굴을 찾아내는 기술입니다."

이 기술은 앞으로 스마트폰 카메라의 자동 보정 기능이나 사진 편집 앱에서, 우리가 원하는 '자연스러운 아름다움'을 더 정확하게 구현하는 데 쓰일 것으로 기대됩니다.