Each language version is independently generated for its own context, not a direct translation.

NOTAI.AI: "AI 가 쓴 글인지 인간이 쓴 글인지 알려주는 똑똑한 탐정"

이 논문은 NOTAI.AI라는 새로운 시스템을 소개합니다. 이 시스템은 AI 가 쓴 글과 사람이 쓴 글을 구별할 뿐만 아니라, **"왜 그렇게 판단했는지"**도 쉽게 설명해 줍니다. 마치 범죄 수사에서 범인을 잡을 때 단순히 "범인이다"라고 말하는 게 아니라, "이 지문과 이 목격 증언 때문에 범인이라고 결론 내렸다"라고 상세히 설명해 주는 것과 같습니다.

이 시스템을 이해하기 위해 몇 가지 재미있는 비유를 들어보겠습니다.

1. 왜 이 시스템이 필요한가요? (문제 상황)

요즘 AI 는 글을 너무 잘 씁니다. 문법도 완벽하고, 사람처럼 자연스럽게 말도 잘합니다. 하지만 문제는 진짜인지 가짜인지 구별하기가 점점 어려워진다는 것입니다.

기존의 탐정들 (기존 AI 탐지기) 은 "이건 AI 가 쓴 것 같아"라고 점수만 줄 뿐, 왜 그런지 설명해 주지 못했습니다. 마치 "이 사람은 범인이다"라고만 말하고 증거를 보여주지 않는 형사처럼, 사람들은 그 말을 믿기 어렵습니다. 또한, AI 가 글을 조금만 변형해도 탐지기가 망설이는 경우가 많았습니다.

2. NOTAI.AI 는 어떻게 작동할까요? (해결책)

NOTAI.AI 는 세 명의 전문 형사 (검증 도구) 가 팀을 이루어 사건을 해결하는 방식으로 작동합니다.

🕵️‍♂️ 형사 1: "곡선 분석가" (Curvature)

이 형사는 글의 흐름이 너무 매끄러운지를 봅니다.

비유: 사람이 글을 쓸 때는 생각의 흐름이 불규칙하고, 때로는 엉뚱한 방향으로 가기도 합니다. 마치 산책할 때 발걸음이 들쑥날쑥한 것처럼요.
반면, AI 는 확률적으로 가장 '안전한' 단어를 선택하기 때문에 글의 흐름이 너무 매끄럽고 평탄합니다. 이 형사는 그 '매끄러운 곡선'을 찾아내어 AI 의 흔적을 포착합니다.

🧠 형사 2: "뇌과학자" (Neural Features)

이 형사는 최신 AI 모델 (ModernBERT) 을 이용해 글의 숨겨진 패턴을 분석합니다.

비유: 글자 하나하나를 보지 않고, 글 전체의 '분위기'나 '맥락'을 읽는 전문가입니다. "이 문장은 AI 가 배운 데이터 패턴과 너무 비슷해"라고 감지합니다.

✍️ 형사 3: "스타일 분석가" (Stylometric Features)

이 형사는 글의 문체와 스타일을 뜯어봅니다.

비유: 사람이 글을 쓸 때는 문장 길이가 다양하고, 반복되는 단어가 적으며, 문장 부호 사용이 개성적입니다. 하지만 AI 는 종종 같은 단어를 반복하거나, 문장 길이가 일정하게 유지되는 경향이 있습니다. 이 형사는 "너무 반복되네?", "문장 부호 사용이 기계적이네?"라고 지적합니다.

3. 최종 판단과 설명 (결정과 이유)

세 형사가 각자 수집한 증거 (17 가지의 다양한 단서) 를 XGBoost라는 똑똑한 지휘관에게 가져갑니다. 지휘관은 이 모든 증거를 종합하여 "인간이 썼다" 또는 "AI 가 썼다"라고 최종 판결을 내립니다.

하지만 여기서 끝이 아닙니다. NOTAI.AI 의 가장 큰 장점은 이유를 설명해 준다는 점입니다.

SHAP (샤피) 라는 번역기: 지휘관이 내린 판결은 복잡한 수학 공식으로 되어 있어 일반인이 이해하기 어렵습니다. 그래서 SHAP라는 도구를 써서 "이 증거가 판결에 30% 기여했다"라고 숫자로 변환합니다.
LLM (대규모 언어 모델) 이 쓴 해설: 숫자만으로는 여전히 어렵습니다. 그래서 또 다른 AI(지식인) 가 이 숫자들을 보고 사람이 읽기 쉬운 자연어로 바꿔줍니다.
- 예시: "이 글은 문장 길이가 너무 일정하고, 특정 단어가 반복되어 AI 가 쓴 것으로 판단됩니다. 하지만 문맥이 매우 자연스러워 인간이 쓴 것처럼 보일 수도 있습니다."

4. 실제로 어떻게 쓸 수 있나요? (웹 애플리케이션)

이 시스템은 누구나 쓸 수 있는 웹 사이트로 만들어졌습니다.

글을 입력: 사용자가 의심스러운 글을 붙여넣습니다.
판단 받기: 화면에 "인간 90% / AI 10%" 같은 게이지가 나옵니다.
이유 확인: "왜 AI 라고 했나요?"라고 물으면, 시스템이 "문장 부호 사용이 기계적이고, 어휘 다양성이 낮기 때문입니다"라고 친절하게 설명해 줍니다.
실험하기: "만약 이 부분 (예: 반복되는 단어) 을 빼면 어떻게 될까?"라고 직접 실험해 볼 수도 있습니다.

5. 결론: 왜 이것이 중요한가요?

이 연구는 단순히 "AI 글 찾기"를 넘어서, 사람들이 AI 의 판단을 이해하고 신뢰할 수 있게 만드는 것에 초점을 맞췄습니다.

교육자: 학생의 과제가 AI 가 쓴 건지, 진짜 학생이 쓴 건지 명확한 근거를 가지고 판단할 수 있습니다.
기자/연구자: 뉴스나 논문이 AI 에 의해 조작되었는지 확인하는 데 도움을 줍니다.
일반인: 인터넷의 글이 진짜인지 가짜인지 의심할 때, 단순히 "AI 가 쓴 것 같다"는 막연한 느낌이 아니라 구체적인 증거를 볼 수 있습니다.

한 줄 요약:
NOTAI.AI 는 AI 가 쓴 글을 찾아내는 단순한 감지기가 아니라, "왜 AI 가 쓴 글인지" 그 이유를 친절하게 설명해 주는 똑똑한 파트너입니다.

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI: "AI 가 쓴 글인지 인간이 쓴 글인지 알려주는 똑똑한 탐정"

1. 왜 이 시스템이 필요한가요? (문제 상황)

2. NOTAI.AI 는 어떻게 작동할까요? (해결책)

🕵️‍♂️ 형사 1: "곡선 분석가" (Curvature)

🧠 형사 2: "뇌과학자" (Neural Features)

✍️ 형사 3: "스타일 분석가" (Stylometric Features)

3. 최종 판단과 설명 (결정과 이유)

4. 실제로 어떻게 쓸 수 있나요? (웹 애플리케이션)

5. 결론: 왜 이것이 중요한가요?

NOTAI.AI: 곡률 (Curvature) 및 특징 할당을 통한 설명 가능한 AI 생성 텍스트 탐지

1. 문제 정의 (Problem)

2. 방법론 (Methodology)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI: "AI 가 쓴 글인지 인간이 쓴 글인지 알려주는 똑똑한 탐정"

1. 왜 이 시스템이 필요한가요? (문제 상황)

2. NOTAI.AI 는 어떻게 작동할까요? (해결책)

🕵️‍♂️ 형사 1: "곡선 분석가" (Curvature)

🧠 형사 2: "뇌과학자" (Neural Features)

✍️ 형사 3: "스타일 분석가" (Stylometric Features)

3. 최종 판단과 설명 (결정과 이유)

4. 실제로 어떻게 쓸 수 있나요? (웹 애플리케이션)

5. 결론: 왜 이것이 중요한가요?

NOTAI.AI: 곡률 (Curvature) 및 특징 할당을 통한 설명 가능한 AI 생성 텍스트 탐지

1. 문제 정의 (Problem)

2. 방법론 (Methodology)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

유사한 논문

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

DeReason: A Difficulty-Aware Curriculum Improves Decoupled SFT-then-RL Training for General Reasoning

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Markovian Generation Chains in Large Language Models