Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

이 논문은 기존 방법론들의 한계를 극복하고 결정론적 최적화와 확률적 샘플링을 통합하는 'Score-Guided Proximal Projection(SGPP)' 프레임워크를 제안하여, 사전 훈련된 스코어 필드를 활용한 정규 축소 속성을 통해 분포 외 입력을 데이터 매니폴드로 효과적으로 정렬하면서도 유연한 이미지 편집과 복원을 가능하게 합니다.

Vansh Bansal, James G Scott

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제 상황: "그림을 고치기 힘든 AI"

AI 가 그림을 그리는 방식 (Rectified Flow) 은 이미 매우 훌륭합니다. 하지만 우리가 "고양이를 사자로 바꿔줘"라고 명령하거나, 흐릿한 사진을 선명하게 만들 때 두 가지 큰 문제가 발생합니다.

  • 문제 A: 너무 꽉 잡힌 AI (기하학적 잠금, Geometric Locking)

    • 비유: 마치 철제 로봇이 그림을 수정하는 상황입니다. 로봇은 원래 그림의 뼈대 (윤곽선) 를 절대 벗어나지 못하게 고정해 둡니다.
    • 결과: "고양이를 사자로"라고 해도, 로봇은 고양이의 귀 모양이나 몸통 형태를 절대 바꾸지 못합니다. 그냥 고양이 털만 사자처럼 바뀐 '기괴한 고양이'가 나옵니다. 너무 원본에 집착해서 새로운 아이디어를 받아주지 못하는 것입니다.
  • 문제 B: 너무 불안정한 AI (확률적 샘플링, DPS)

    • 비유: 마치 미끄러운 빙판에서 그림을 고치는 상황입니다. AI 가 "여기서 저기로 가자"라고 계산하지만, 계산을 할 때마다 미끄러져서 엉뚱한 곳으로 날아가버립니다.
    • 결과: 계산이 너무 복잡하고 불안정해서, 그림이 뭉개지거나 엉망이 되는 경우가 많습니다.

2. 해결책: SGPP (스마트한 나침반)

이 논문은 이 두 문제를 모두 해결하는 SGPP라는 새로운 방법을 제안합니다.

핵심 비유: "탄성 있는 고무줄"과 "지형도"

SGPP 는 그림을 고칠 때 두 가지 힘을 동시에 사용합니다.

  1. 원본에 묶여 있는 고무줄 (Fidelity):
    • 그림의 원래 모양 (고양이의 얼굴) 을 잃지 않도록 잡아주는 힘입니다. 하지만 이 고무줄은 완전히 딱딱한 철줄이 아니라, 약간의 탄성이 있는 고무줄입니다.
  2. 지형도 (Score Field):
    • AI 가 이미 배운 "사자가 어떻게 생겼는지"에 대한 지식 (지형도) 입니다. 이 지형도를 따라가면 자연스럽게 사자가 됩니다.

SGPP 의 마법:
이 방법은 고무줄을 너무 꽉 당기지 않으면서 (탄성 허용), 지형도를 따라 자연스럽게 이동하게 합니다.

  • 원본의 특징 (고양이 얼굴) 은 유지하되,
  • 새로운 특징 (사자의 갈기, 넓은 주둥이) 은 유연하게 추가할 수 있습니다.

3. SGPP 가 어떻게 작동하나요? (세 가지 단계)

① "안전한 길"을 보장합니다 (Normal Contraction)

AI 가 길을 잃고 엉뚱한 곳 (예: 고양이와 사자가 섞인 괴물) 으로 갈 때, SGPP 는 **"이건 아니야, 다시 안전한 길 (데이터가 존재하는 영역) 로 돌아와"**라고 부드럽게 잡아당깁니다.

  • 비유: 마치 자석처럼, AI 가 엉뚱한 방향으로 가려 하면 자연스럽게 원래 있어야 할 '진짜 그림'의 길로 다시 끌어당깁니다. 그래서 그림이 뭉개지거나 이상해지는 것을 막아줍니다.

② "부드러운 안내"를 제공합니다 (Soft Guidance)

기존 방법들은 "원본을 100% 유지하라"거나 "완전히 새로 그려라"는 식으로 이분법적이었습니다. 하지만 SGPP 는 스위치를 조절할 수 있습니다.

  • 비유: 볼륨 조절 노브를 돌리는 것과 같습니다.
    • 노브를 왼쪽으로 (원본 유지): 고양이 얼굴을 거의 그대로 유지하며 털만 바꿉니다.
    • 노브를 오른쪽으로 (생성 자유도): 고양이 얼굴을 사자 얼굴로 완전히 바꿔도 됩니다.
    • 이 중간 구간에서 사용자는 원하는 만큼의 변화를 자유롭게 조절할 수 있습니다.

③ "계산 없이" 빠르게 작동합니다

기존의 복잡한 방법들은 매번 "이게 맞는지 다시 계산"하는 과정에서 시간이 오래 걸리고 불안정했습니다. 하지만 SGPP 는 AI 가 이미 가지고 있는 **지식 (Score Field)**을 직접 활용합니다.

  • 비유: 복잡한 지도를 다시 그리는 대신, 이미 머릿속에 있는 지형도를 보고 바로 길을 찾는 것과 같습니다. 그래서 빠르고 안정적입니다.

4. 결론: 왜 이것이 중요한가요?

이 기술은 **사진 복원 (흐린 사진 선명하게)**이나 이미지 편집 (고양이를 사자로) 같은 작업에서 혁신을 가져옵니다.

  • 이전: "원본을 너무 잘 지키려니 바꿀 게 없다"거나 "바꾸려니 원본이 망가진다"는 딜레마가 있었습니다.
  • 이제 (SGPP): "원본의 정체성은 지키되, 새로운 상상력은 자유롭게" 표현할 수 있는 완벽한 균형을 찾았습니다.

한 줄 요약:

SGPP 는 AI 가 그림을 고칠 때, 원본의 특징을 잃지 않으면서도 새로운 아이디어를 자연스럽게 받아들일 수 있게 도와주는 '지능적이고 유연한 나침반'입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →