PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints

이 논문은 문장을 기본 단위로 처리하는 의미 수준 워터마킹의 강건성과 왜곡 없는 특성을 보장하기 위해 프록시 함수 기반의 새로운 이론적 프레임워크를 제안하고, 이를 통해 기존 방법들보다 우수한 성능을 보이는 PMark 방법을 개발했습니다.

Jiahao Huo, Shuliang Liu, Bin Wang, Junyan Zhang, Yibo Yan, Aiwei Liu, Xuming Hu, Mingxun Zhou

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌊 PMARK: AI 가 쓴 글을 찾아내는 '보이지 않는 지문'

이 논문은 인공지능 (AI) 이 쓴 글사람이 쓴 글을 구별하는 새로운 기술을 소개합니다. 특히, AI 가 글을 다시 쓰거나 (Paraphrasing) 다듬을 때에도 그 흔적이 사라지지 않도록 하는 **'강력한 디지털 지문'**을 만드는 방법을 제안합니다.

이 기술을 **'PMARK'**라고 부르는데, 기존 방식의 문제점을 해결하고 더 똑똑하고 안전한 방법을 제시합니다.


🤔 왜 이런 기술이 필요할까요?

지금 AI 는 글을 아주 잘 씁니다. 하지만 AI 가 쓴 글이 진짜인지 가짜인지 구별하기 어렵다는 문제가 생겼습니다.

  • 저작권 문제: AI 가 쓴 글을 사람이 쓴 것처럼 팔 수 있습니다.
  • 허위 정보: AI 가 만든 가짜 뉴스가 퍼질 수 있습니다.

그래서 연구자들은 AI 가 글을 쓸 때 **보이지 않는 '수영장' (Watermark)**을 남기려고 노력해 왔습니다. 하지만 기존 기술들은 두 가지 큰 약점이 있었습니다.

  1. 글의 맛을 망친다 (Distortion): AI 가 글을 쓸 때, 특정 단어를 강제로 고르도록 하면 글이 어색해지거나 자연스러움이 떨어집니다. (마치 맛있는 요리에 색소만 넣은 것처럼요.)
  2. 쉽게 지워진다 (Fragile): 누군가 AI 가 쓴 글을 다른 말로 바꿔서 (재작성) 다시 쓰면, 그 '수영장' 흔적이 사라져버립니다.

💡 PMARK 의 핵심 아이디어: "의미 있는 문장"에 도장을 찍자!

기존 기술은 단어 하나하나에 도장을 찍었습니다. 하지만 PMARK 는 문장 전체를 하나의 단위로 봅니다.

🎨 비유 1: 단어 vs 문장

  • 기존 방식 (단어 단위): 글을 쓸 때마다 "빨간색 단어"를 골라 넣습니다. 하지만 누군가 글을 다듬어서 "빨간색 단어"를 "파란색 단어"로 바꾸면 흔적이 사라집니다.
  • PMARK 방식 (문장 단위): 문장 전체의 **의미 (Semantic)**를 보고 도장을 찍습니다. 문장의 뜻이 같다면, 단어가 바뀌어도 도장은 그대로 남습니다.

🔍 PMARK 가 어떻게 작동할까요? (세 가지 마법)

PMARK 는 세 가지 핵심 기술을 섞어서 작동합니다.

1. 🎯 '가상 나침반' (Proxy Function)

PMARK 는 AI 가 쓸 다음 문장을 예측할 때, 미리 정해진 **무작위 나침반 (벡터)**을 사용합니다.

  • 비유: AI 가 글을 쓸 때, 마치 "북쪽을 향한 문장"과 "남쪽을 향한 문장"을 구분하듯이, 문장의 방향을 수치로 측정합니다.
  • 이 나침반을 통해 문장이 특정 기준 (예: 중위수) 에 해당하는지 확인합니다.

2. 🛡️ '다중 보안 문' (Multi-Channel Constraints)

기존 방식은 문장을 한 번만 검사했습니다. 하지만 PMARK 는 **여러 개의 나침반 (채널)**을 동시에 사용합니다.

  • 비유: 한 개의 자물쇠만 있는 금고는 쉽게 뚫립니다. 하지만 4 개의 자물쇠를 동시에 잠그면 훨씬 안전합니다.
  • PMARK 는 문장이 4 개의 서로 다른 나침반 기준을 모두 통과해야만 '수영장'이 찍힌 문장으로 인정합니다. 이렇게 하면 글이 조금 변형되어도 (재작성되어도) 흔적이 남습니다.

3. 🎭 '자연스러운 선택' (Distortion-Free)

가장 중요한 점은 글의 질을 해치지 않는다는 것입니다.

  • 비유: 기존 방식은 "이 단어만 써야 해!"라고 강요해서 글이 어색해졌습니다. 하지만 PMARK 는 "이 문장들이 모두 자연스럽지만, 그중에서 나침반 기준을 맞는 문장을 골라줘"라고 합니다.
  • 수학적으로 증명했듯이, 이 방식은 AI 가 원래 쓰려던 글의 분포를 그대로 유지하면서 도장만 남깁니다. 마치 투명한 잉크로 도장을 찍는 것과 같습니다.

🚀 PMARK 의 성과: 무엇이 달라졌나요?

논문에서 실험한 결과, PMARK 는 기존 기술들보다 압도적으로 뛰어났습니다.

  1. 재작성 공격에도 강함: GPT 나 다른 AI 가 글을 완전히 다듬어서 다시 써도, PMARK 는 90% 이상의 확률로 "이건 AI 가 쓴 글이야!"라고 찾아냅니다. (기존 기술들은 50% 미만으로 떨어지기도 했습니다.)
  2. 글의 자연스러움 유지: 글이 어색해지지 않아서, 사람이 읽어도 AI 가 쓴 줄 모를 정도로 자연스럽습니다.
  3. 빠른 속도: 문장을 고르는 데 드는 계산 비용이 적어서 실제 서비스에 적용하기 좋습니다.

📝 한 줄 요약

PMARK 는 AI 가 쓴 글에 "의미 있는 문장" 단위로 투명한 지문을 찍는 기술로, 글이 아무리 다듬어져도 흔적이 사라지지 않고, 글의 맛도 그대로 유지합니다.

이 기술은 앞으로 AI 가 만든 콘텐츠가 넘쳐나는 세상에서, 진짜와 가짜를 구별하고 저작권을 보호하는 핵심 열쇠가 될 것입니다.