MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

이 논문은 기존 캐싱 방법의 한계를 극복하고 Jacobian-벡터 곱을 활용한 평균 속도 관점과 궤적 안정성 스케줄링 전략을 통해 FLUX.1 및 HunyuanVideo 등 다양한 모델에서 고품질 생성을 유지하면서 3.5 배 이상 가속화를 실현하는 훈련 불필요한 MeanCache 프레임워크를 제안합니다.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 1. 문제: "너무 빨리 달리다 보면 길을 잃는다"

인공지능이 그림을 그릴 때, 처음엔 잡음 (소음) 에서 시작해 점점 선명한 그림으로 변해갑니다. 이 과정에서 AI 는 매순간 "지금 이 순간에 어디로 가야 할까?"를 계산합니다.

기존의 빠른 방법들은 **"지금 이 순간의 속도"**만 보고 다음 단계로 점프했습니다.

  • 비유: 산을 오르는 등산객이 생각해보죠.
    • 기존 방식: "지금 발걸음 속도가 시속 5km 야! 그럼 다음 10 분 뒤엔 이 속도로 5km 더 가겠지!"라고 계산합니다.
    • 문제점: 하지만 산길은 구불구불합니다. 지금 속도가 빨라도 곧 길이 꺾이거나 오르막이 나올 수 있죠. 그래서 "지금 속도"만 믿고 계속 직진하면, 결국 산 정상 (완성된 그림) 에서 멀어지고, 엉뚱한 곳에 떨어지거나 (화질 저하), 길을 잃게 됩니다.

🚀 2. 해결책: "평균 속도로 길을 재단하다"

이 논문은 **'MeanCache'**라는 새로운 방법을 제안합니다. 핵심은 **'순간 속도'가 아니라 '평균 속도'**를 사용하는 것입니다.

  • 새로운 방식: "지금 이 순간의 속도만 보지 말고, **앞으로 10 분 동안 갈 전체 경로의 '평균 속도'**를 계산해서 다음 단계로 가자."
  • 비유:
    • 등산객이 "지금 발걸음만 보지 말고, 앞으로 10 분 동안 내가 걸을 전체 거리를 미리 계산해서 평균 내면 시속 3km 정도겠네"라고 생각합니다.
    • 이렇게 평균을 내면, 순간적인 오르막이나 내리막의 흔들림을 상쇄할 수 있어 길을 훨씬 정확하게 찾아갈 수 있습니다.

🧠 3. 기술의 핵심: "기억력 (캐시) 과 지도 (스케줄링)"

이 기술은 두 가지 마법 같은 도구를 사용합니다.

① JVP(자코비안 - 벡터 곱) = "과거의 기억을 활용한 예측"

  • AI 가 매번 모든 계산을 다시 하면 시간이 너무 걸립니다. 그래서 **이전에 계산했던 데이터 (캐시)**를 재활용합니다.
  • 하지만 그냥 과거 데이터를 가져오면 오류가 쌓입니다.
  • MeanCache 의 아이디어: "과거에 계산했던 **수학적 변화율 (JVP)**을 이용해서, '지금 순간 속도'를 '평균 속도'로 보정하자."
  • 비유: 등산객이 "어제 이 길에서 비가 와서 미끄러졌던 기억 (과거 데이터) 을 바탕으로, 오늘 이 길의 평균 경사를 정확히 예측해서 발을 디디는 것"입니다.

② 궤적 안정성 스케줄링 = "최적의 휴식 지도 그리기"

  • 언제 계산을 건너뛰고 (캐싱), 언제 다시 계산해야 할지 정하는 것이 중요합니다. 무작정 건너뛰면 화질이 망가집니다.
  • MeanCache 의 아이디어: 모든 길목 (시간 단계) 을 노드로 보고, "여기서 건너뛰면 얼마나 위험할까?"를 계산한 뒤, **가장 안전한 길 (최단 경로)**을 찾아냅니다.
  • 비유: 등산객이 "이곳은 위험해서 천천히 가고, 저곳은 평지라서 빨리 지나가자"라고 최적의 휴식 지도를 그려서 걷는 것입니다. 이 지도는 AI 가 다시 훈련할 필요 없이, 미리 계산된 데이터로 자동으로 만들어집니다.

🏆 4. 결과: "빠르면서도 완벽한 그림"

이 기술을 적용한 결과, 기존 방법들보다 3~4 배 이상 빨라졌습니다.

  • FLUX.1(이미지 생성 모델): 4.12 배 빨라짐.
  • Qwen-Image(이미지 생성 모델): 4.56 배 빨라짐.
  • HunyuanVideo(영상 생성 모델): 3.59 배 빨라짐.

중요한 점:
기존 방법들은 속도를 높이면 그림이 흐려지거나 (블러), 모양이 뭉개지거나 (왜곡) 했습니다. 하지만 MeanCache 는 속도를 4 배로 높여도 원래 그림의 디테일과 선명함을 거의 잃지 않았습니다. 마치 "고속도로를 4 배 속도로 달리면서도 차가 흔들리지 않고 목적지에 정확히 도착하는 것"과 같습니다.

💡 요약

MeanCache는 인공지능이 그림을 그릴 때, "지금 당장의 속도"에 집착하지 않고 "전체 경로의 평균"을 계산하여 길을 재단하는 기술입니다.

  • 기존: "지금 빨라! 계속 가자!" → 길을 잃고 화질 나쁨.
  • MeanCache: "이 구간은 평균 속도로 계산해서 가자!" → 길을 정확히 찾아 화질 유지 + 속도 4 배 향상.

이 기술은 인공지능이 더 빠르고 저렴하게, 하지만 더 똑똑하게 그림과 영상을 만들 수 있게 해주는 혁신적인 '스마트 캐시' 시스템입니다.