Pay-Per-Crawl Pricing for AI: The LM-Tree Agent

이 논문은 AI 크롤러의 콘텐츠 소비 증가에 대응하여, LLM 을 활용해 콘텐츠의 특성을 자동으로 학습하고 세분화하는 'LM-Tree' 에이전트를 제안함으로써 고정 가격 모델보다 65% 높은 수익을 달성한 새로운 '크롤링 단위 과금' 모델을 소개합니다.

Richard Archer, Soheil Ghili, Nima Haghpanah

게시일 2026-04-03
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 AI 가 글을 읽을 때, 어떻게 돈을 받아야 할까?

"LM-Tree": 인공지능을 위한 똑똑한 가격 책정 비서

이 논문은 **"AI 가 웹사이트 글을 읽을 때, 출판사는 어떻게 돈을 받아야 할까?"**라는 아주 실용적이고 시급한 문제를 다룹니다.

과거에는 사람들이 검색해서 글을 읽었고, 출판사는 광고로 돈을 벌었습니다. 하지만 이제는 **AI(로봇)**가 직접 글을 읽어서 학습하거나 답변을 만드는 데 씁니다. 문제는 AI 가 글을 읽어도 출판사에게 돈을 주지 않는다는 점입니다.

이 논문은 **"AI 가 글을 읽을 때마다 돈을 내는 시스템 (Pay-Per-Crawl)"**을 제안하고, 그중에서도 **"어떤 글에 얼마를 매겨야 할지"**를 자동으로 찾아내는 **'LM-Tree(엘엠-트리)'**라는 똑똑한 시스템을 소개합니다.


🌳 1. 왜 기존 방식은 안 될까요? (고정 가격의 한계)

출판사 입장에서 생각해보면, 모든 글은 다릅니다.

  • 고급 그래픽카드 리뷰: AI 가 배우고 싶어 하는 '보석 같은' 글입니다. (비싸게 팔아야 함)
  • 단순 뉴스 한 줄: 누구나 알 수 있는 쉬운 정보입니다. (싸게 팔아야 함)

기존 방식은 **"모든 글을 똑같은 가격에 팔자"**거나, **"카테고리별로 (예: 하드웨어, 소프트웨어) 가격을 정하자"**는 식이었습니다. 하지만 이는 마치 **"명품 시계와 장난감 시계를 똑같은 가격에 파는 것"**과 같습니다.

  • 문제 1: 글의 가치는 글자 속에 숨어 있습니다. (메타데이터가 아니라 글 내용 자체)
  • 문제 2: 글의 종류가 너무 다양해서 사람이 일일이 가격을 정할 수 없습니다.

🧠 2. LM-Tree 는 무엇인가요? (똑똑한 나무 구조)

LM-Tree는 출판사의 모든 글을 한 그루의 **'지능형 나무'**로 상상해 보세요. 이 나무는 AI(대형 언어 모델) 가 직접 돈을 받을 만한 기준을 찾아서 가지를 치고, 각 가지마다 다른 가격을 매깁니다.

이 나무는 두 명의 **'AI 비서'**와 함께 작동합니다.

👨‍💼 비서 1: 분석가 (Analyst) - "무엇이 비싼가?"

  • 역할: 글을 읽어가며 "어떤 글이 AI 가 더 많이 읽고 싶어 할까?"를 찾아냅니다.
  • 방법: AI 가 글을 읽었을 때, **비싼 가격에도 구매된 글 (High)**과 **싼 가격에만 팔린 글 (Low)**을 비교합니다.
  • 발견: 분석가는 "아! **'엔터테인먼트 리프트 (engagement lift)'**라는 단어가 있는 글은 비싸게 팔리고, **'데이터 포인트'**만 있는 글은 싸게 팔리는구나!"라고 깨닫습니다.
  • 비유: 마치 부동산 중개인이 "이 동네는 '학교'가 있으면 비싸고, '공원'이 있으면 더 비싸구나"라고 깨닫는 것과 같습니다.

📝 비서 2: 기록관 (Annotator) - "누가 어디에 속하나?"

  • 역할: 분석가가 찾아낸 기준 (예: '엔터테인먼트 리프트' 언급 여부) 을 모든 글에 적용합니다.
  • 결과: 모든 글에 "이건 고급 글", "이건 보통 글"이라는 라벨을 붙입니다.
  • 특징: 이 과정은 처음에 한 번만 하면 됩니다. 나중에 AI 가 글을 읽을 때는 이 라벨만 보고 가격을 매기면 되므로, 매번 AI 를 부를 필요가 없습니다. (빠르고 효율적)

🌲 3. 나무가 어떻게 자라나요? (분할과 가격 책정)

  1. 시작: 모든 글을 '리뷰'와 '뉴스' 두 가지 큰 가지로 나눕니다.
  2. 가격 실험: 각 가지에서 다양한 가격을 시도해 봅니다. (예: $0.1, $0.5, $1.0)
  3. 분할 (Split):
    • 만약 "고급 GPU(그래픽카드) 스펙"을 다룬 글들은 비싼 가격에도 팔리고, 일반 뉴스는 비싸면 안 팔린다면?
    • 나무는 가지를 치습니다! "고급 GPU 리뷰"라는 새로운 가지가 생기고, 여기엔 비싼 가격을, 나머지는 싼 가격을 매깁니다.
  4. 반복: 이 과정이 계속 반복되면서, 나무는 출판사가 생각지도 못했던 세밀한 가격 구간을 찾아냅니다.

📊 4. 실제 성과: 출판사의 지갑이 두둑해졌습니다!

논문의 연구진은 독일의 유명 IT 출판사 (HardwareLuxx) 의 실제 데이터 (약 9,000 개 기사) 로 실험했습니다.

  • 단일 고정 가격: 모든 글을 같은 가격에 팔 때 → $160 수익
  • 간단한 카테고리 가격: '리뷰'와 '뉴스'만 구분할 때 → $179 수익
  • 출판사의 기존 8 가지 카테고리: (하드웨어, 소프트웨어 등) → $189 수익
  • LM-Tree (이 시스템):$264 수익

결과: 기존 방식보다 최대 65% 더 많은 수익을 올렸습니다!
가장 놀라운 점은, 출판사가 직접 만든 '카테고리 분류'보다 LM-Tree 가 스스로 찾아낸 분류가 AI 가 원하는 가치를 더 잘 반영했다는 것입니다. 예를 들어, 출판사는 '하드웨어'로 묶어두었지만, LM-Tree 는 "고급 GPU 스펙이 포함된 글"과 "일반 하드웨어 글"을 구분해 훨씬 더 정교하게 가격을 매겼습니다.

💡 5. 핵심 교훈: "무엇을 팔지"보다 "어떻게 팔지"가 중요하다

이 논문은 단순히 AI 에게 글을 파는 방법을 알려주는 것을 넘어, 미래의 비즈니스 모델을 보여줍니다.

  • 기존 방식: "우리는 하드웨어 글을 팝니다. 가격은 $1 입니다." (정해진 규칙)
  • LM-Tree 방식: "우리는 글을 팝니다. AI 가 이 글에서 무엇을 원하는지, AI 가 스스로 찾아서 가격을 매깁니다." (적응형 규칙)

결론적으로, LM-Tree 는 **"글자 속에 숨겨진 가치"**를 AI 가 스스로 발견하게 해주는 스마트한 가격 책정 시스템입니다. 이는 AI 가 더 많은 일을 하고, 더 많은 데이터를 소비하게 될 미래에, 콘텐츠 제작자들이 살아남기 위해 꼭 필요한 기술입니다.

한 줄 요약: "AI 가 글을 읽을 때, 모든 글을 같은 값에 팔지 말고, AI 가 진짜 원하는 '보석 같은 글'을 찾아내서 비싸게 팔아라! 그 일을 대신해 주는 똑똑한 나무가 바로 LM-Tree 입니다." 🌳💰

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →