Each language version is independently generated for its own context, not a direct translation.
1. 기존 기술의 문제점: "딱딱한 가면"과 "유리벽"
기존의 AI 사진 합성 기술은 마치 매우 딱딱한 가면을 쓰거나, 유리벽으로 사람들을 가르는 방식이었습니다.
- 문제: 여러 사람을 한 장에 넣으려면, AI 는 "이쪽은 A 사람, 저쪽은 B 사람"이라고 딱 정해줘야 했습니다.
- 결과: 사람들이 서로 자연스럽게 어울리지 못하고, 나이를 바꾸는 작업 (예: 어른을 아이로 변신시키기) 이 불가능했습니다. 마치 "어른 얼굴을 아이 몸통에 억지로 끼워 맞추는" 꼴이 되어, 얼굴이 어색하게 변하거나 몸통이 어른처럼 커지는 '괴기스러운' 결과가 나왔습니다.
- 논문이 부르는 이름: '안정성 - 가소성 딜레마' (Stability-Plasticity Dilemma). 즉, "얼굴을 똑같이 유지하려는 고집 (안정성)"과 "나이를 바꾸거나 자세를 자연스럽게 하려는 유연함 (가소성)" 사이에서 AI 가 미쳐버리는 상황입니다.
2. IdGlow 의 해결책: "지혜로운 마법사"의 두 단계
IdGlow 는 이 문제를 해결하기 위해 두 단계로 나누어 작업을 진행합니다. 마치 요리를 할 때, 먼저 재료를 다듬고 (1 단계), 그다음에 맛을 보며 다듬는 (2 단계) 과정과 같습니다.
1 단계: "상황에 맞춰 타이밍을 조절하는" SFT (지도 학습)
이 단계는 AI 가 사진을 그리는 순서와 타이밍을 가르치는 과정입니다.
- 비유: 그림을 그릴 때, 초반에는 전체적인 구도 (몸통, 자세) 를 잡고, 중반에 얼굴의 특징 (눈, 코, 입) 을 그리고, 후반에 피부 질감이나 빛을 입히는 것과 같습니다.
- 핵심 기술 (동적 정체성 조절):
- 단순 합성: 초반에 얼굴 특징을 확실히 잡게 한 뒤, 후반에는 자연스럽게 빛과 자세를 조정합니다.
- 나이 바꾸기 (어른→아이): 여기서가 핵심입니다! AI 는 "아이의 몸통"을 그릴 때는 얼굴 특징을 잠시 숨깁니다. 아이답게 작고 동글동글한 얼굴 구조가 먼저 만들어지도록요. 그다음, 가장 중요한 중간 단계에서만 "아, 이 아이는 원래 A 사람이다"라고 얼굴 특징을 살짝 주입합니다. 마지막에는 피부 질감을 다듬습니다.
- 효과: 이렇게 하면 아이 몸통에 어른 얼굴이 억지로 끼워지는 '미니어처 어른' 같은 괴물이 사라지고, A 사람의 특징을 가진 진짜 아이가 탄생합니다.
2 단계: "미식가 심사위원" DPO (선호도 최적화)
1 단계로 만든 그림이 "얼굴은 비슷하지만 뭔가 어색하다"거나 "화질이 안 좋다"면, 2 단계에서 다듬습니다.
- 비유: 요리사가 만든 요리를 미식가 심사위원이 맛보고 "이건 너무 짜다", "저건 너무 매끄럽다"라고 지적하면, 요리사가 다시 다듬는 과정입니다.
- 작동 방식: AI 는 실제 사람들이 찍은 자연스러운 단체 사진을 '정답 (참고 자료)'으로 삼고, AI 가 만든 어색한 사진은 '오답'으로 분류합니다. 그리고 "정답처럼 만들어라!"라고 강하게 학습시킵니다.
- 효과: 얼굴이 자연스럽게 섞이고, 피부 질감이 선명해지며, 전체적인 분위기가 상업용 광고 사진처럼 고퀄리티가 됩니다.
3. 추가적인 꿀팁: "명확한 지시서" (프롬프트)
AI 가 그림을 그릴 때, "여기 사람 A 와 사람 B 를 그려줘"라고만 하면 AI 는 헷갈려서 옷 색깔이나 얼굴 특징을 섞어버립니다.
- IdGlow 의 해결책: AI 가 스스로 상세한 지시서를 작성하게 합니다. "사람 A 는 왼쪽에 서 있고 파란 셔츠를 입었으며, 사람 B 는 오른쪽에 앉아 있고 빨간 모자를 썼다"처럼 구체적으로 설명해 줍니다. 이렇게 하면 AI 가 헷갈릴 틈이 없어집니다.
🌟 요약: 왜 이 기술이 특별한가요?
- 자연스러운 합성: 여러 사람을 합쳐도 서로의 얼굴이 뭉개지지 않고, 빛과 그림자도 자연스럽게 어울립니다.
- 나이 바꾸기 가능: 어른을 아이로, 아이를 어른으로 변신시킬 때 얼굴 특징은 유지하되 몸통과 비율은 자연스럽게 바뀝니다. (기존 기술은 불가능했던 부분)
- 고퀄리티: 단순히 얼굴만 붙이는 게 아니라, 사진 전체의 화질과 예술적 완성도까지 높여줍니다.
한 줄 평:
"기존 기술이 여러 사람을 억지로 붙여놓은 '콜라주'였다면, IdGlow 는 여러 사람이 자연스럽게 어울려 있는 '진짜 단체 사진'을 만들어내는 지혜로운 사진 작가입니다."