Denoising as Path Planning: Training-Free Acceleration of Diffusion Models with DPCache

이 논문은 확산 모델의 추론 속도를 높이기 위해 기존 캐싱 방법의 한계를 극복하고, 경로 의존적 오차를 정량화한 비용 텐서를 동적 계획법을 통해 최적화하는 'DPCache'라는 새로운 훈련 없는 가속 프레임워크를 제안합니다.

Bowen Cui, Yuanbin Wang, Huajiang Xu, Biaolong Chen, Aixi Zhang, Hao Jiang, Zhengzheng Jin, Xu Liu, Pipei Huang

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

그림을 그리는 '마법사'를 더 빠르게 만드는 비법: DPCache

이 논문은 최근 화제가 되는 생성형 AI(Diffusion Models)가 그림이나 영상을 만들 때, 너무 느리다는 문제를 해결한 새로운 방법론을 소개합니다.

기존의 AI 그림 그리기는 마치 안개 낀 산을 한 걸음 한 걸음 천천히 올라가며 정확한 길을 찾는 과정과 비슷합니다. 50~100 단계나 되는 긴 여정을 모두 다 걸어야 완벽한 그림이 나오는데, 이 과정이 너무 오래 걸려서 실생활에 쓰기 어렵다는 것이 문제였습니다.

이 논문은 **"어떤 길은 건너뛰어도 되고, 어떤 길은 꼭 걸어야 한다"**는 아이디어로 이 문제를 해결했습니다. 이를 DPCache라고 부르는데, 쉽게 설명해 드릴게요.


1. 기존 방법들의 문제점: "무작정 건너뛰기" vs "눈앞만 보기"

기존에 그림을 빨리 그리려고 했던 방법들은 두 가지 단점이 있었습니다.

  • 고정된 스케줄 (Fixed Schedule): "10 단계마다 한 번씩 건너뛰자!"라고 정해버리는 방식입니다.
    • 비유: 산을 오를 때, "10 걸음마다 10 걸음 뛰어넘어!"라고 정해버린 거예요. 평지에서는 괜찮지만, **가파른 절벽 **(중요한 변화 구간)을 만나도 무조건 뛰어넘으려다 넘어지거나 길을 잃어버립니다.
  • 국소적 적응 (Locally Adaptive): "지금 단계가 평지 같으면 건너뛰고, 험하면 걸어가자"라고 그 순간의 상황만 보고 결정하는 방식입니다.
    • 비유: 눈앞의 작은 돌만 피하느라, **앞에 있는 큰 낭떠러지 **(중요한 전환점)를 보지 못하고 떨어지는 경우입니다. 나중에 다시 제자리로 돌아오기엔 너무 늦은 경우가 많습니다.

2. DPCache 의 해결책: "전체 지도를 보고 계획하기"

DPCache 는 이 문제를 **등산 경로 계획 **(Path Planning)에 비유합니다.

상상해 보세요:
등산객이 정상에 가기 위해 50 개의 지점을 지나야 합니다.

  1. **보조 등산객 **(Calibration) 먼저 작은 팀이 전체 50 단계를 다 걸어가며 "어디가 험하고, 어디를 건너뛰면 큰 실수가 날까?"를 미리 조사합니다.
  2. **지도 만들기 **(Cost Tensor) 이 조사 결과를 바탕으로 **"어떤 지점 A 에서 지점 B 로 건너뛰면 얼마나 큰 오류 **(비용)를 계산한 3 차원 지도를 만듭니다. (단순히 A 와 B 만 보는 게 아니라, 그전에 어디를 거쳐왔는지도 고려합니다.)
  3. **최적 경로 찾기 **(Dynamic Programming) 이제 컴퓨터가 이 지도를 보고, "전체 오류를 최소화하면서 가장 빠르게 정상에 도달하는 경로를 수학적으로 계산합니다.
    • 예: "처음 3 단계는 무조건 걷고, 410 단계 중 2 단계만 건너뛰고, 1120 단계는 5 단계만 건너뛰고..." 이런 식으로 전체 여정을 고려한 최적의 스케줄을 짜는 것입니다.

3. 실제 작동 원리: "계산"과 "예측"의 조화

이제 실제 그림을 그릴 때 (Inference) 어떻게 작동할까요?

  1. **핵심 지점 **(Key Timesteps) 계산된 최적 경로에 있는 중요한 지점들에서는 AI 가 **온 힘을 다해 **(Full Computation) 그림을 그립니다.
  2. **중간 지점 **(Intermediate Steps) 그 사이의 지점들은 **이전에 계산해 둔 자료 **(Cache)를 활용해서 간단히 예측합니다.
    • 비유: 등산할 때, 험한 구간에서는 발걸음을 천천히 재며 꼼꼼히 밟지만, 평지 구간에서는 **이전에 찍어둔 발자국 **(캐시)을 보고 "아, 여기는 평지구나"라고 빠르게 지나가는 것과 같습니다.

4. 왜 이것이 대단한가요?

이 방법은 **학습 **(Training)이 필요 없습니다. (이미 훈련된 AI 를 그대로 사용합니다.)

  • 속도: 기존 방법보다 훨씬 빠릅니다. (예: FLUX 모델에서 약 4.87 배 빠름)
  • 품질: 속도를 내면서도 그림의 퀄리티는 떨어지지 않습니다. 오히려 다른 빠른 방법들보다 더 선명하고 정확한 그림을 만듭니다.
  • 적용: 이미지 생성뿐만 아니라 **영상 생성 **(HunyuanVideo)에서도 똑같이 잘 작동합니다.

5. 한 줄 요약

"AI 가 그림을 그릴 때, 무작정 모든 걸 계산하지 말고, '어디가 중요한지' 미리 파악해서 중요한 순간에만 집중하고 나머지는 빠르게 건너뛰게 해주는 '스마트한 등산 가이드'를 개발했다."

이 기술 덕분에 앞으로 우리가 AI 로 그림이나 영상을 만들 때, 기다리는 시간이 획기적으로 줄어들고 더 많은 창작물을 빠르게 즐길 수 있게 될 것입니다.