Dual Randomized Smoothing: Beyond Global Noise Variance

이 논문은 전역 노이즈 분산의 한계를 극복하고 다양한 반경에서 강력한 인증된 강인성을 달성하기 위해 입력별 노이즈 분산을 예측하는 '이중 무작위 평활화 (Dual Randomized Smoothing)' 프레임워크를 제안합니다.

Chenhao Sun, Yuhao Mao, Martin Vechev

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 핵심 비유: "모든 상황에 맞는 한 가지 안경" vs "상황에 따라 갈아끼는 스마트 안경"

1. 기존 방식의 문제점: "한 가지 크기의 안경"

기존의 AI 보호 기술 (랜덤화 스무딩) 은 AI 가 그림을 볼 때, 모든 그림에 똑같은 양의 '노이즈 (소음)'를 섞어서 보게 합니다.

  • 작은 소음 (작은 노이즈): 아주 작은 변화도 잘 알아차리지만, 그림이 조금만 흐려져도 (큰 공격이 가해지면) 완전히 망가져서 못 봅니다.
  • 큰 소음 (큰 노이즈): 그림이 흐려져도 (큰 공격이 가해져도) 여전히 알아볼 수 있지만, 아주 작은 변화는 구별하지 못해 정확도가 떨어집니다.

문제: 기존 기술은 **"전 세계 모든 그림에 똑같은 소음 양 (노이즈 크기)"**을 적용했습니다. 그래서 "작은 공격에는 약하고, 큰 공격에는 정확도가 낮아지는" 딜레마에 빠졌습니다. 마치 한 가지 크기만 있는 안경을 모든 사람에게 똑같이 끼우는 것과 같습니다. 눈이 나쁜 사람에게는 너무 작고, 눈이 좋은 사람에게는 너무 커서 둘 다 불편하죠.

2. 이 논문의 해결책: "상황을 보고 안경을 바꿔주는 '스마트 안경'"

저자들은 **"각 그림마다 필요한 소음의 양이 다르다"**는 사실을 발견했습니다. 어떤 그림은 작은 소음만 섞어도 되고, 어떤 그림은 큰 소음이 필요할 수도 있습니다.

이제 **두 단계로 이루어진 새로운 시스템 (Dual RS)**을 제안합니다.

  • 1 단계: '소음 전문가' (Variance Estimator)

    • AI 가 그림을 보기 전에, 먼저 **'소음 전문가'**라는 작은 AI 가 그림을 훑어봅니다.
    • 이 전문가가 말합니다. "이 그림은 작은 소음이 필요해!" 또는 "이 그림은 큰 소음이 필요해!"라고요.
    • 마치 눈을 검사하는 의사가 환자의 시력에 따라 안경 도수를 처방하는 것과 같습니다.
  • 2 단계: '본격적인 AI' (Classifier)

    • 이제 '소음 전문가'가 처방한 맞춤형 소음을 그림에 섞어서, 메인 AI 가 그림을 분류합니다.
    • 덕분에 작은 공격에는 작은 소음으로 정확도를 유지하고, 큰 공격에는 큰 소음으로 안전성을 확보할 수 있습니다.

🛡️ 왜 이것이 안전할까요? (이론적 증명)

사람들이 걱정할 수 있는 질문은 **"소음 양을 그림마다 바꾼다고 해서, 해커가 그 틈을 타서 AI 를 속일 수 있지 않을까?"**입니다.

저자들은 수학적으로 증명했습니다.

"전 세계에 똑같은 소음 양을 쓰는 게 아니라, 각 그림 주변 (근처) 에서는 소음 양이 일정하게 유지된다면, 여전히 AI 는 안전하게 공격을 막아낼 수 있다."

비유:
전국 모든 도로의 속도 제한을 60km 로 고정하는 대신, 도로 구간별로 (학교 앞, 고속도로) 속도 제한을 다르게 설정하되, 그 구간 안에서는 규칙이 명확하고 일정하다면, 교통 안전 (AI 의 안전성) 은 여전히 보장된다는 뜻입니다.


🚀 이 기술이 가져오는 혜택

  1. 모든 상황에서 강함: 작은 공격이든 큰 공격이든, 상황에 맞는 '소음'을 써서 두 마리 토끼를 다 잡습니다. (기존 방식은 둘 중 하나만 선택해야 했습니다.)
  2. 비용 효율적: 두 단계를 거치지만, 계산 비용이 기존 방식보다 60% 정도만 늘어나서 실용적입니다.
  3. 유연한 전문가 시스템 (라우팅): 이 시스템은 단순히 소음만 조절하는 게 아니라, "어떤 그림에는 A 라는 전문가 AI 를, 어떤 그림에는 B 라는 전문가 AI 를 쓰게" 할 수도 있습니다. 마치 병원에서 가벼운 증상은 일반 진료, 복잡한 증상은 전문의에게 보내는 정밀한 진료 시스템처럼 작동합니다.

📝 한 줄 요약

이 논문은 **"모든 상황에 똑같은 안경을 끼우는 구식 방식"**을 버리고, **"각 그림의 특성에 맞춰 소음 (안경 도수) 을 자동으로 조절해주는 스마트 시스템"**을 만들어, AI 가 더 작고 큰 공격 모두에 대해 훨씬 더 강력하고 정확하게 방어하도록 만들었습니다.