DRIFT: Deep Restoration, ISP Fusion, and Tone-mapping

이 논문은 손으로 들고 촬영한 RAW 이미지를 고품질 RGB 이미지로 변환하기 위해 멀티프레임 정렬, 노이즈 제거, 디모osaicing, 초해상도를 수행하는 생성적 적대 신경망 (GAN) 기반의 MFP 네트워크와 모바일 기기에서 효율적으로 실행 가능한 딥러닝 기반 톤 매핑 (DRIFT-TM) 을 결합한 'DRIFT'라는 새로운 AI 모바일 카메라 파이프라인을 제안합니다.

Soumendu Majee, Joshua Peter Ebenezer, Abhinau K. Venkataramanan, Weidi Liu, Thilo Balke, Zeeshan Nadir, Sreenithy Chandran, Seok-Jun Lee, Hamid Rahim Sheikh

게시일 2026-04-07
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📸 DRIFT: 스마트폰 사진의 '마법 같은 조리법'

스마트폰 카메라는 작은 렌즈를 가지고 있어 빛을 많이 받지 못합니다. 그래서 손이 조금만 떨려도 사진이 흐려지고 (노이즈), 밤이나 역광 같은 상황에서는 검은 부분은 너무 검고, 밝은 부분은 하얗게 날아가버립니다.

기존의 카메라는 이 문제를 해결하기 위해 여러 장의 사진을 합치거나 (다중 프레임), 복잡한 수학적 공식을 사용했습니다. 하지만 DRIFT 는 **인공지능 (AI)**을 이용해 이 과정을 훨씬 더 똑똑하고 빠르게 처리합니다.

DRIFT 는 크게 세 단계로 이루어진 '요리 과정'과 같습니다.

1 단계: 재료 다듬기 (DRIFT-MFP)

비유: 흐릿하게 찍힌 여러 장의 초벌 사진을 한 장의 선명한 원재료로 만드는 과정

스마트폰은 사진을 찍을 때 아주 짧은 시간 동안 여러 장의 원시 데이터 (Raw) 를 찍습니다. 하지만 손이 떨려서 이 사진들은 모두 흔들리고 노이즈가 섞여 있습니다.

  • 기존 방식: 컴퓨터가 "이건 흔들렸네, 저건 노이즈가 많네"라고 하나하나 계산하며 합칩니다.
  • DRIFT-MFP: AI 가 마치 수천 번 사진을 찍어본 요리사처럼, 흔들린 여러 장의 사진을 한눈에 보며 "아, 이 부분은 이 사진이 선명하네, 저 부분은 저 사진이 좋네"라고 판단합니다.
  • 핵심 기술: 이 요리사는 단순히 합치는 게 아니라, **GAN(적대적 신경망)**이라는 기술을 써서 "이게 진짜 자연스러운 사진이야, 아니면 가짜야?"를 스스로 판단하며 훈련합니다. 그래서 결과물이 인위적인 느낌 없이 매우 자연스럽습니다.

2 단계: 맛과 색감 조절 (Fusion ISP)

비유: 어두운 부분과 밝은 부분을 적절히 섞어 '하이라이트'와 '그림자'를 모두 살리는 과정

사진에는 너무 어두운 부분 (EV-) 과 너무 밝은 부분 (EV0) 이 공존합니다.

  • DRIFT 는 이 두 가지 정보를 완벽하게 섞어서 (Fusion) 한 장의 고화질 (HDR) 사진을 만듭니다. 마치 어두운 숲속과 햇살이 비치는 창문을 한 장의 사진에 모두 선명하게 담아내는 것과 같습니다.

3 단계: 최종 플레이팅 (DRIFT-TM)

비유: 요리한 음식을 접시에 예쁘게 담고, 손님의 취향에 따라 간을 맞추는 과정

이제 만들어진 고화질 사진은 너무 밝거나 색감이 과할 수 있습니다. 이를 우리가 보는 화면 (스마트폰 디스플레이) 에 맞게 조절하는 것을 **톤매핑 (Tone-mapping)**이라고 합니다.

  • 문제점: 기존 AI 방식은 한 번 학습하면 끝입니다. "조금 더 밝게 해줘"라고 말하면 다시 학습을 해야 하거나, 화면을 잘게 나누어 처리하다 보니 이어지는 부분에서 색감이 달라지는 (타일링) 문제가 생깁니다.
  • DRIFT-TM 의 혁신: 이 기술은 마치 요리사가 마지막에 소스를 뿌리는 것처럼 작동합니다.
    1. 베이스 (Lite): AI 가 기본 맛 (밝기, 색상) 을 빠르게 잡아줍니다.
    2. 보정 (Residual): AI 는 "베이스에서 어떤 부분을 더 강조할지"만 계산합니다.
    3. 취향 조절 (Tunability): 가장 중요한 점은, AI 모델을 다시 학습시키지 않아도 사용자가 "조금 더 대비를 강하게 해줘"나 "하이라이트를 더 살려줘"라고 설정만 바꾸면, AI 가 즉시 그 취향에 맞춰 결과를 바꿔준다는 것입니다. 마치 요리에 간을 맞추듯이 실시간으로 조절 가능한 것입니다.

🌟 왜 이 기술이 특별한가요?

  1. 자연스러움: AI 가 만든 사진이 마치 기계가 그린 것처럼 거칠거나 인위적인 느낌 (아티팩트) 이 없습니다. 마치 진짜 사람이 찍은 것 같은 자연스러운 질감을 유지합니다.
  2. 빠른 속도: 이 모든 복잡한 작업을 스마트폰의 AI 칩 (NPU) 에서 4 초도 채 걸리지 않게 처리합니다. (약 3.2 초에 11 장의 사진을 처리하고, 0.5 초에 색감을 다듬습니다.)
  3. 유연성: 같은 AI 모델로도 사용자가 원하는 대로 사진의 분위기 (밝기, 대비, HDR 효과) 를 바꿀 수 있습니다.

📝 한 줄 요약

DRIFT는 스마트폰이 흔들리는 손이나 어두운 밤에도 AI 요리사가 여러 장의 흐릿한 사진을 모아 **자연스럽고 선명한 masterpiece(작품)**를 만들어내고, 사용자가 마지막에 간을 맞추듯 사진의 분위기를 자유롭게 조절할 수 있게 해주는 차세대 카메라 기술입니다.

이 기술 덕분에 앞으로 우리가 찍는 스마트폰 사진은 전문가가 찍은 것만큼 선명하고, 원하는 대로 예쁘게 변할 수 있게 될 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →