NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

이 논문은 곡률 기반 신호와 신경망 및 스타일론적 특징을 통합한 XGBoost 메타 분류기와 SHAP 기반 설명 시스템을 통해 기계 생성 텍스트를 탐지하고 자연어 근거를 제공하는 설명 가능한 프레임워크 'NOTAI.AI'를 제안합니다.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah

게시일 2026-03-09
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

NOTAI.AI: "AI 가 쓴 글인지 인간이 쓴 글인지 알려주는 똑똑한 탐정"

이 논문은 NOTAI.AI라는 새로운 시스템을 소개합니다. 이 시스템은 AI 가 쓴 글과 사람이 쓴 글을 구별할 뿐만 아니라, **"왜 그렇게 판단했는지"**도 쉽게 설명해 줍니다. 마치 범죄 수사에서 범인을 잡을 때 단순히 "범인이다"라고 말하는 게 아니라, "이 지문과 이 목격 증언 때문에 범인이라고 결론 내렸다"라고 상세히 설명해 주는 것과 같습니다.

이 시스템을 이해하기 위해 몇 가지 재미있는 비유를 들어보겠습니다.


1. 왜 이 시스템이 필요한가요? (문제 상황)

요즘 AI 는 글을 너무 잘 씁니다. 문법도 완벽하고, 사람처럼 자연스럽게 말도 잘합니다. 하지만 문제는 진짜인지 가짜인지 구별하기가 점점 어려워진다는 것입니다.

기존의 탐정들 (기존 AI 탐지기) 은 "이건 AI 가 쓴 것 같아"라고 점수만 줄 뿐, 그런지 설명해 주지 못했습니다. 마치 "이 사람은 범인이다"라고만 말하고 증거를 보여주지 않는 형사처럼, 사람들은 그 말을 믿기 어렵습니다. 또한, AI 가 글을 조금만 변형해도 탐지기가 망설이는 경우가 많았습니다.

2. NOTAI.AI 는 어떻게 작동할까요? (해결책)

NOTAI.AI 는 세 명의 전문 형사 (검증 도구) 가 팀을 이루어 사건을 해결하는 방식으로 작동합니다.

🕵️‍♂️ 형사 1: "곡선 분석가" (Curvature)

이 형사는 글의 흐름이 너무 매끄러운지를 봅니다.

  • 비유: 사람이 글을 쓸 때는 생각의 흐름이 불규칙하고, 때로는 엉뚱한 방향으로 가기도 합니다. 마치 산책할 때 발걸음이 들쑥날쑥한 것처럼요.
  • 반면, AI 는 확률적으로 가장 '안전한' 단어를 선택하기 때문에 글의 흐름이 너무 매끄럽고 평탄합니다. 이 형사는 그 '매끄러운 곡선'을 찾아내어 AI 의 흔적을 포착합니다.

🧠 형사 2: "뇌과학자" (Neural Features)

이 형사는 최신 AI 모델 (ModernBERT) 을 이용해 글의 숨겨진 패턴을 분석합니다.

  • 비유: 글자 하나하나를 보지 않고, 글 전체의 '분위기'나 '맥락'을 읽는 전문가입니다. "이 문장은 AI 가 배운 데이터 패턴과 너무 비슷해"라고 감지합니다.

✍️ 형사 3: "스타일 분석가" (Stylometric Features)

이 형사는 글의 문체와 스타일을 뜯어봅니다.

  • 비유: 사람이 글을 쓸 때는 문장 길이가 다양하고, 반복되는 단어가 적으며, 문장 부호 사용이 개성적입니다. 하지만 AI 는 종종 같은 단어를 반복하거나, 문장 길이가 일정하게 유지되는 경향이 있습니다. 이 형사는 "너무 반복되네?", "문장 부호 사용이 기계적이네?"라고 지적합니다.

3. 최종 판단과 설명 (결정과 이유)

세 형사가 각자 수집한 증거 (17 가지의 다양한 단서) 를 XGBoost라는 똑똑한 지휘관에게 가져갑니다. 지휘관은 이 모든 증거를 종합하여 "인간이 썼다" 또는 "AI 가 썼다"라고 최종 판결을 내립니다.

하지만 여기서 끝이 아닙니다. NOTAI.AI 의 가장 큰 장점은 이유를 설명해 준다는 점입니다.

  • SHAP (샤피) 라는 번역기: 지휘관이 내린 판결은 복잡한 수학 공식으로 되어 있어 일반인이 이해하기 어렵습니다. 그래서 SHAP라는 도구를 써서 "이 증거가 판결에 30% 기여했다"라고 숫자로 변환합니다.
  • LLM (대규모 언어 모델) 이 쓴 해설: 숫자만으로는 여전히 어렵습니다. 그래서 또 다른 AI(지식인) 가 이 숫자들을 보고 사람이 읽기 쉬운 자연어로 바꿔줍니다.
    • 예시: "이 글은 문장 길이가 너무 일정하고, 특정 단어가 반복되어 AI 가 쓴 것으로 판단됩니다. 하지만 문맥이 매우 자연스러워 인간이 쓴 것처럼 보일 수도 있습니다."

4. 실제로 어떻게 쓸 수 있나요? (웹 애플리케이션)

이 시스템은 누구나 쓸 수 있는 웹 사이트로 만들어졌습니다.

  1. 글을 입력: 사용자가 의심스러운 글을 붙여넣습니다.
  2. 판단 받기: 화면에 "인간 90% / AI 10%" 같은 게이지가 나옵니다.
  3. 이유 확인: "왜 AI 라고 했나요?"라고 물으면, 시스템이 "문장 부호 사용이 기계적이고, 어휘 다양성이 낮기 때문입니다"라고 친절하게 설명해 줍니다.
  4. 실험하기: "만약 이 부분 (예: 반복되는 단어) 을 빼면 어떻게 될까?"라고 직접 실험해 볼 수도 있습니다.

5. 결론: 왜 이것이 중요한가요?

이 연구는 단순히 "AI 글 찾기"를 넘어서, 사람들이 AI 의 판단을 이해하고 신뢰할 수 있게 만드는 것에 초점을 맞췄습니다.

  • 교육자: 학생의 과제가 AI 가 쓴 건지, 진짜 학생이 쓴 건지 명확한 근거를 가지고 판단할 수 있습니다.
  • 기자/연구자: 뉴스나 논문이 AI 에 의해 조작되었는지 확인하는 데 도움을 줍니다.
  • 일반인: 인터넷의 글이 진짜인지 가짜인지 의심할 때, 단순히 "AI 가 쓴 것 같다"는 막연한 느낌이 아니라 구체적인 증거를 볼 수 있습니다.

한 줄 요약:
NOTAI.AI 는 AI 가 쓴 글을 찾아내는 단순한 감지기가 아니라, "왜 AI 가 쓴 글인지" 그 이유를 친절하게 설명해 주는 똑똑한 파트너입니다.