CASCADE: LLM-Powered JavaScript Deobfuscator at Google

이 논문은 구글의 Gemini 와 JavaScript IR 을 결합한 하이브리드 방식인 CASCADE 를 통해 기존 규칙 기반 접근법의 한계를 극복하고, 코드 가독성 및 분석 효율성을 획기적으로 개선한 JavaScript 역어셈블리 시스템을 소개합니다.

Shan Jiang, Pranoy Kovuri, David Tao, Zhixun Tan

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

CASCADE: 구글의 '악성 코드 해독기' 이야기

이 논문은 구글에서 개발한 CASCADE라는 새로운 도구에 대해 설명합니다. 이 도구는 웹상에서 악성 코드를 숨기거나 복잡하게 만드는 '난독화 (Obfuscation)'된 자바스크립트 코드를 다시 원래의 깔끔한 형태로 되돌려주는 역할을 합니다.

이 복잡한 기술 이야기를 일반인도 쉽게 이해할 수 있도록 마법사, 해적의 지도, 그리고 정밀한 기계의 비유로 풀어보겠습니다.


1. 문제: "왜 코드는 이렇게 엉망으로 변했을까?"

웹사이트나 앱이 작동하려면 자바스크립트라는 언어가 필요합니다. 하지만 해커들은 이 코드를 읽기 어렵게 변형시켜서 (난독화) 자신의 악의적인 의도를 숨깁니다.

  • 비유: 해커가 보물 지도를 그렸다고 상상해 보세요. 하지만 지도를 읽을 수 없게 만들기 위해, 글자를 모두 뒤섞고, 숫자로만 된 암호를 넣으며, 지도를 여러 장으로 잘라낸 뒤 다시 붙여놓았습니다. 이제 이 지도를 보고 보물 (악성 코드) 을 찾으려면 엄청난 노력이 필요합니다.

기존의 해독 도구들은 이 암호를 풀기 위해 수천 개의 규칙을 외워야 했습니다. 하지만 해커가 암호 규칙을 아주 조금만 바꿔도 (예: true!false로 바꾸는 것), 기존 도구들은 완전히 망가져서 작동하지 않았습니다.

2. 해결책: CASCADE (두 명의 파트너가 함께 일하다)

CASCADE 는 이 문제를 해결하기 위해 두 명의 전문가를 팀으로 꾸렸습니다.

1 단계: AI 마법사 (Gemini) 가 "열쇠"를 찾는다

첫 번째 파트너는 구글의 초지능 AI인 Gemini입니다.

  • 역할: 해커가 만든 복잡한 코드 속에서 **"시작 열쇠 (Prelude Functions)"**를 찾아냅니다.
  • 비유: 해적의 지도가 뒤섞여 있을 때, AI 마법사는 "아! 이 부분만 보면 원래 지도가 어떻게 생겼는지 알 수 있겠구나!"라고 눈치챕니다. AI 는 수천 개의 규칙을 외울 필요 없이, 코드의 맥락을 이해하고 열쇠가 어디에 있는지 찾아냅니다.
  • 장점: 해커가 암호를 살짝 바꿔도 AI 는 "아, 이건 여전히 같은 열쇠구나"라고 알아챕니다.

2 단계: 정밀한 기계 (JSIR) 가 "해독"을 수행한다

두 번째 파트너는 구글의 **컴파일러 기술 (JSIR)**로 만든 정밀한 기계입니다.

  • 역할: AI 가 찾아낸 열쇠를 이용해 암호를 정확하게 풀어냅니다.
  • 비유: AI 가 "여기 열쇠가 있어요!"라고 알려주면, 정밀한 기계는 그 열쇠로 자물쇠를 열고, 암호화된 글자들을 하나하나 원래 단어 (예: "Hello World") 로 바꾸고, 숫자 계산을 정확히 수행합니다.
  • 중요한 점: AI 는 가끔 "환각 (Hallucination)"이라고 해서, 없는 것을 있는 것처럼 말하거나 계산을 틀릴 수 있습니다. 하지만 기계는 절대 실수하지 않습니다. "1+1=2"를 틀릴 리가 없죠.

3. CASCADE 의 혁신적인 방식: "혼합 (Hybrid)" 전략

이 도구의 가장 큰 특징은 AI 와 기계가 서로의 단점을 보완한다는 점입니다.

  • 기존 방식의 문제:
    • AI 만 쓰면: 계산 실수를 해서 코드가 망가질 수 있습니다. (예: "Hello"를 "Hell0"로 잘못 바꿈)
    • 기계만 쓰면: 해커가 암호 규칙을 조금만 바꿔도 아예 작동하지 않습니다.
  • CASCADE 의 방식:
    1. AI가 "어디에 열쇠가 있는지"만 찾아냅니다. (이 부분은 AI 가 잘합니다.)
    2. 기계가 그 열쇠로 "정확하게 해독"합니다. (이 부분은 기계가 잘합니다.)

이 덕분에 CASCADE 는 해커가 암호를 어떻게 변형시키든 상관없이, 99% 이상의 정확도로 코드를 원래 모습으로 되돌릴 수 있습니다.

4. 실제 효과: 구글에서 어떻게 쓰일까요?

이 기술은 이미 구글의 실제 서비스 (프로덕션 환경) 에서 작동하고 있습니다.

  • 속도: 파일 하나를 해독하는 데 평균 2 초 정도밖에 걸리지 않습니다.
  • 효율: 하루에 수백만 개의 자바스크립트 파일을 스캔할 수 있습니다.
  • 결과: 해커가 숨겨둔 악성 코드를 쉽게 찾아낼 수 있게 되어, 사용자들이 더 안전한 인터넷 환경을 즐길 수 있게 되었습니다.

요약: 한 줄로 정리하면?

"CASCADE 는 AI 마법사가 복잡한 암호의 '열쇠'를 찾아주고, 정밀한 기계가 그 열쇠로 암호를 완벽하게 풀어주는, 해커의 난독화 코드를 무력화시키는 구글의 최신 보안 무기입니다."

이 기술은 인공지능의 창의성과 기계의 정확성을 결합하여, 소프트웨어 보안 분야에서 새로운 기준을 제시하고 있습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →