Detecting RAG Advertisements Across Advertising Styles

이 논문은 생성형 RAG 광고의 다양한 스타일 (명시성과 호소 유형) 을 분류하고, 이러한 스타일 변화에 따른 탐지 모델의 견고성을 평가하여 엔티티 인식 기반 모델은 효과적이지만 경량 모델은 취약함을 밝혔습니다.

Sebastian Heineking, Wilhelm Pertsch, Ines Zelch, Janek Bevendorff, Benno Stein, Matthias Hagen, Martin Potthast

게시일 2026-03-06
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"AI 가 답변을 할 때, 그 사이에 숨겨진 광고를 어떻게 찾아낼 것인가?"**에 대한 연구입니다.

과거에는 검색 엔진에서 광고가 "검색 결과 옆"에 따로 표시되었지만, 앞으로는 AI(챗봇) 가 답변을 할 때 자연스러운 문장 속에 광고를 섞어서 보여줄 가능성이 높습니다. 마치 요리사가 요리에 소금 대신 '비밀스러운 향신료'를 섞어 넣는 것처럼 말이죠.

이 논문은 그 '비밀스러운 향신료'를 찾아내는 기술이 얼마나 튼튼한지, 그리고 광고주가 그 향신료의 맛을 바꿔서 숨기려 할 때 어떻게 대응할지 실험했습니다.

핵심 내용을 쉽게 풀어서 설명해 드릴게요.


1. 상황: AI 의 답변 속에 숨겨진 광고 (생성형 네이티브 광고)

미래의 AI 는 사용자의 질문에 답할 때, "이 여행지 추천해요"라고 말하다가 중간에 **"FUN Flights(여행사) 에서 15% 할인 쿠폰이 있어요!"**라는 문장을 자연스럽게 끼워 넣을 수 있습니다.

  • 문제점: 이 광고가 너무 자연스럽게 섞여 있으면, 사용자가 "아, 이건 광고구나"라고 눈치채기 어렵습니다. 마치 잡지 기사 속에 숨겨진 광고 (네이티브 광고) 와 비슷하죠.
  • 목표: 사용자에게 "여기 광고가 숨어 있어요!"라고 알려주는 **탐정 (검출기)**을 만드는 것입니다.

2. 실험: 광고주의 '변장'과 탐정의 '수사'

연구진은 광고주가 탐정을 피하려고 어떻게 변장할지 시뮬레이션했습니다. 광고는 크게 두 가지 '스타일'로 나뉩니다.

  1. 노골적인 스타일 (Overt): "저희 제품이 최고예요! 지금 사세요!"라고 크게 외치는 것. (눈에 잘 띕니다.)
  2. 은밀한 스타일 (Covert): "혹시 spontaneus(즉흥적인) 여행을 원하신다면 FUN Flights 도 괜찮을 거예요"라고 아주 자연스럽게 톡 건네는 것. (눈에 잘 안 띕니다.)

또한, 광고가 호소하는 방식도 나눕니다.

  • 이성적 (Rational): "배터리가 20 시간 갑니다, 가격이 10% 쌉니다" (사실 나열).
  • 감성적 (Emotional): "자유의 맛을 느껴보세요, 설레는 여행의 시작" (감정 자극).

실험 방법:

  • 1 단계: 먼저 다양한 광고 스타일로 만든 데이터를 학습시켜 '초보 탐정 (AI 모델)'을 훈련시켰습니다.
  • 2 단계: 이제 광고주가 변장합니다. "아까 배운 스타일이 아니라, 새로운 은밀한 스타일로 광고를 만들어볼게요."
  • 3 단계: 훈련된 탐정이 새로운 변장한 광고도 찾아낼 수 있는지 테스트했습니다.

3. 결과: 어떤 탐정이 가장 잘할까?

연구진은 세 가지 종류의 '탐정'을 비교했습니다.

A. 문장 전체를 보는 탐정 (Sentence Classifiers)

  • 방식: "이 문장 전체가 광고 같아?"라고 판단합니다.
  • 결과: 광고가 노골적일 때는 잘 찾았지만, 광고가 은밀하게 섞이거나 (Covert), 새로운 AI 가 만든 광고는 놓치는 경우가 많았습니다.
  • 비유: "이 사람이 범죄자야?"라고 얼굴만 보고 판단하는 형사. 변장을 잘하면 속아 넘어갑니다.

B. 단어 하나하나를 보는 탐정 (Token Classifiers - 최고의 성능)

  • 방식: 문장 속의 단어 하나하나를 분석합니다. "여기 'FUN Flights'라는 회사 이름이 나왔고, 바로 옆에 '할인'이라는 단어가 붙었네? 이건 광고구나!"라고 정확한 위치를 찾아냅니다.
  • 결과: 가장 강력했습니다. 광고 스타일이 바뀌거나, 새로운 AI 가 만들어도 광고를 찾아내는 능력이 매우 뛰어났습니다. 특히 'ModernBERT'라는 모델이 가장 잘했습니다.
  • 비유: 범죄 현장의 지문 감식반. 변장을 해도 지문 (단어 패턴) 은 변하지 않으므로, 숨겨진 광고의 '지문'을 찾아냅니다.

C. 가벼운 탐정 (랜덤 포레스트, SVM 등)

  • 방식: 스마트폰처럼 성능이 낮은 기기에서도 빠르게 돌아갈 수 있는 간단한 규칙을 사용합니다.
  • 결과: 너무 약했습니다. 광고 스타일이 조금만 바뀌어도 완전히 무너졌습니다.
  • 비유: 간단한 체크리스트만 들고 있는 순경. 변장한 범죄자 앞에서는 무력합니다.

4. 핵심 교훈 (인사이트)

  1. 광고는 점점 더 교묘해집니다: 광고주는 탐정을 피하기 위해 광고 스타일을 계속 바꿀 것입니다.
  2. 단순한 규칙으로는 안 됩니다: "광고에는 '할인'이라는 단어가 자주 나온다" 같은 단순한 규칙은 통하지 않습니다. 문맥을 이해하는 **고급 AI(단어 단위 분석)**가 필요합니다.
  3. 은밀한 광고가 가장 위험합니다: 감정을 자극하거나 아주 자연스럽게 섞인 광고는 찾기 가장 어렵습니다.
  4. 정확한 위치 파악이 중요: 단순히 "광고가 있네"라고 알려주는 것보다, **"어디에 숨어 있는지"**를 정확히 찾아내야만 사용자가 광고만 지우고 나머지 유용한 정보는 볼 수 있습니다.

5. 결론: 앞으로는 어떻게 될까?

이 연구는 **"AI 가 답변할 때 광고를 섞어 넣는 시대가 오면, 우리는 강력한 '단어 단위 분석 AI'를 만들어서 광고를 정확히 찾아내고 차단해야 한다"**는 것을 증명했습니다.

하지만 아직 해결해야 할 과제가 있습니다.

  • 가벼운 기기 문제: 가장 잘하는 AI 모델은 무겁고 비쌉니다. 일반 사용자의 스마트폰에서 이걸 돌리려면 더 가볍고 빠른 기술이 필요합니다.
  • 지속적인 싸움: 광고주가 변장을 더 교묘하게 하면, 탐정도 더 똑똑해져야 하는 '고양이와 쥐'의 게임이 계속될 것입니다.

한 줄 요약:

"AI 가 답변 속에 숨겨진 광고를 찾아내는 일은, 단순히 '광고 문구'를 찾는 게 아니라 문장 속 단어들의 미세한 뉘앙스까지 분석하는 정교한 수사가 필요하며, 특히 단어 하나하나를 꼼꼼히 살피는 AI가 가장 효과적입니다."