Detection of Illicit Content on Online Marketplaces using Large Language Models

이 연구는 다국어 DUTA10K 데이터셋을 기반으로 Llama 3.2 와 Gemma 3 와 같은 대규모 언어 모델 (LLM) 이 기존 머신러닝 및 BERT 모델보다 40 개 이상의 복잡한 불법 카테고리 분류에서 뛰어난 성능을 보이며 온라인 마켓플레이스의 불법 콘텐츠 탐지 및 규제에 효과적임을 입증했습니다.

Quoc Khoa Tran, Thanh Thi Nguyen, Campbell Wilson

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 핵심 이야기: "온라인 시장의 감시자"를 어떻게 만들까?

인터넷 쇼핑몰은 세상을 바꿨지만, 동시에 마약, 가짜 제품, 해킹 서비스 같은 불법 거래가 숨어있는 '어두운 시장'이 되기도 했습니다. 기존에 이걸 잡으려던 방법들은 다음과 같은 문제가 있었습니다.

  1. 사람이 일일이 확인하는 것: 너무 느리고, 사람이 할 수 있는 양이 한정되어 있습니다. (100 만 개의 글 중 1 개만 빠뜨려도 큰일 나죠.)
  2. 규칙을 정해둔 프로그램: "마약"이라는 단어가 나오면 막는다? 하지만 범죄자들은 "약" 대신 "건강보조제"나 "특수 영양제" 같은 은어를 쓰거나, 철자를 바꿔서 (예: 'dru9s') 규칙을 피합니다.
  3. 기존 인공지능 (ML): 문장의 뉘앙스나 복잡한 문맥을 이해하지 못해, 진짜 범죄 글을 놓치거나 innocent 한 글을 잘못 잡아챕니다.

이 연구는 **"LLM(거대 언어 모델)"**이라는 최신 AI 기술을 써서 이 문제를 해결할 수 있는지 실험했습니다. 마치 초능력을 가진 탐정을 고용한 것과 같습니다.


🧪 실험 내용: 어떤 AI 가 더 잘할까?

연구진은 두 가지 임무를 주었습니다.

  1. 임무 1 (이진 분류): "이 글이 불법인가? 아니면 합법인가?" (O/X 판정)
  2. 임무 2 (다중 분류): "이게 불법이라면, 구체적으로 뭐야?" (마약, 가짜 신용카드, 총기, 해킹 등 40 가지 종류 중 하나를 골라야 함)

비교 대상은 다음과 같습니다.

  • 전통적인 방법 (SVM, 나이브 베이즈): 예전부터 쓰던 정직한 수리공 같은 도구. 빠르고 간단하지만 복잡한 문제는 못 푼다.
  • 중간 단계 (BERT): 문맥을 어느 정도 이해하는 중견 직원.
  • 최신 AI (Llama 3.2, Gemma 3): 수만 권의 책을 읽고 모든 언어를 이해하는 천재 탐정.

🏆 실험 결과: "상황에 따라 최고의 도구가 다르다"

1. "단순한 O/X 판정"에서는?

  • 결과: 천재 탐정 (LLM) 이도 좋지만, **예전 수리공 (SVM)**도 거의 똑같이 잘했습니다.
  • 비유: "이 물건이 사과인가?"라고 물을 때, 천재가 답을 잘하지만, 간단한 규칙만으로도 충분히 맞출 수 있습니다. 여기서 무거운 천재를 부리는 건 시간과 돈 낭비일 수 있습니다.

2. "40 가지 종류를 구분"하는 복잡한 문제에서는?

  • 결과: **천재 탐정 (Llama 3.2)**이 압도적으로 잘했습니다. 기존 방법들은 40 가지 종류를 구분하느라 혼란스러워하며 많이 틀렸지만, Llama 는 문맥을 깊이 이해해서 정확히 찾아냈습니다.
  • 비유: "이게 사과, 배, 포도, 바나나 등 40 가지 과일 중 뭐야?"라고 물었을 때, 단순한 규칙은 "빨간색이면 사과"라고 잘못 판단하지만, 천재 탐정은 "색깔, 모양, 향기, 문맥"을 모두 종합해 정답을 맞춥니다.

💡 이 연구가 우리에게 주는 교훈

  1. 한 가지 방법이 전부는 아니다:
    • 단순히 "불법인가?"만 확인하면 빠르고 저렴한 기존 AI 로 충분합니다.
    • 하지만 "무슨 불법인가?"까지 세밀하게 파악해야 한다면, 비싸고 무거운 최신 AI (LLM) 가 필요합니다.
  2. 은어와 변장을 뚫는다:
    • 범죄자들이 은어로 말을 바꾸거나 철자를 바꿔도, LLM 은 문맥을 이해하기 때문에 "아, 이건 마약을 파는 글이구나"라고 알아챕니다.
  3. 비용과 성능의 균형:
    • 최신 AI 는 성능이 좋지만, 전기를 많이 먹고 계산하기가 무겁습니다. 그래서 연구진은 **PEFT(파라미터 효율적 미세 조정)**라는 기술을 써서, 거대한 AI 를 조금만 수정해서 가볍게 만들 수 있게 했습니다. (거대한 코끼리를 태운 트럭 대신, 코끼리만 태울 수 있는 경량 트럭을 개조한 셈입니다.)

🚀 결론

이 논문은 **"온라인에서 불법 물건을 잡을 때, 상황에 따라 똑똑한 도구를 골라 써야 한다"**는 것을 증명했습니다.

  • 경찰과 플랫폼: 이제 더 똑똑한 AI 를 써서 범죄자들이 은어로 숨겨둔 불법 거래를 찾아낼 수 있게 되었습니다.
  • 미래: 앞으로는 이 기술이 더 발전해서, 언어 장벽을 넘어서 전 세계의 모든 불법 거래를 실시간으로 막아내는 '초능감시 시스템'이 될 가능성이 큽니다.

간단히 말해, **"이제 범죄자들은 은어로 속여도, AI 천재 탐정들이 다 알아챈다"**는 희망적인 소식입니다.