Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

이 논문은 TOON 이 인-도메인 생성 작업에서 토큰 효율성과 정확도 면에서 유망한 결과를 보이지만, 짧은 컨텍스트에서는 프롬프트 오버헤드로 인해 이점이 감소하며, 특히 단순 구조에서는 제약 디코딩을 통한 JSON 생성이 TOON 보다 더 낮은 토큰 사용량을 보여 TOON 의 효율성은 특정 임계점을 넘어 누적된 구문 절감 효과가 프롬프트 오버헤드를 상쇄할 때 비로소 실현된다는 것을 밝혔습니다.

Ivan Matveev

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍽️ 상황 설정: 레스토랑의 주문 방식

우리는 AI(셰프) 에게 복잡한 주문 내역 (데이터) 을 적어달라고 요청합니다. 이때 세 가지 다른 주문 방식을 비교해 봤습니다.

  1. 기존 방식 (JSON): "우리가 항상 쓰는 표준 메뉴판"입니다. AI 는 이걸 이미 다 알고 있어서 설명이 거의 필요 없습니다. 하지만 글자가 좀 길고 반복되는 부분이 많습니다.
  2. 규칙 준수 방식 (JSON-SO): "표준 메뉴판이지만, 실수하지 않도록 AI 의 손에 가위와 풀을 붙여둔 상태"입니다. AI 가 틀린 글자를 쓸 수 없게 강제로 제한합니다.
  3. 새로운 방식 (TOON): "새로 발명된 초간단 주문 카드"입니다. 글자 수를 획기적으로 줄였지만, AI 가 이걸 처음 보는 것이므로 처음에 사용법을 자세히 가르쳐야 (프롬프트) 합니다.

🔍 실험 결과: 어떤 방식이 이길까요?

1. 간단한 주문 (단순한 데이터)

  • 상황: "아메리카노 2 잔, 에이드 1 잔"처럼 단순한 리스트입니다.
  • 결과:
    • TOON: 설명을 해주는 데 시간이 걸려서, 오히려 전체 비용 (토큰 사용량) 이 더 비싸게 나왔습니다. (새로운 규칙을 배우는 '입문 비용'이 너무 큽니다.)
    • 규칙 준수 방식 (JSON-SO): AI 가 실수할 틈이 없게 막아주니, 가장 빠르고 저렴하게 주문이 완료되었습니다.
    • 기존 방식 (JSON): TOON 보다 조금 비싸지만, 설명 없이 바로 시작해서 나쁘지 않았습니다.

2. 복잡한 주문 (중첩된 데이터)

  • 상황: "회사 조직도"처럼 계층이 깊고 복잡한 구조입니다.
  • 결과:
    • TOON: 처음에 완전히 실패했습니다. (0% 성공률) 하지만 몇 번 다시 시도해 보니, 최종적으로는 가장 적은 비용으로 성공했습니다. 복잡한 구조일수록 TOON 의 '간결함'이 빛을 발하기 때문입니다.
    • 기존 방식 (JSON): AI 가 실수해서 다시 고치는 과정에서 비용이 많이 들었습니다.

💡 핵심 교훈 (이론의 결론)

1. "입문 비용"의 함정 (Prompt Tax)

TOON 은 글자를 아껴주지만, 처음에 "이건 TOON 이야, 이렇게 써"라고 가르쳐주는 설명서 (프롬프트) 가 너무 깁니다.

  • 비유: 작은 우편물을 보낼 때, 우표 대신 "이 우편물은 TOON 형식입니다"라고 큰 박스에 적어 넣는 것과 같습니다. 우편물 자체는 작아졌지만, 박스 크기가 더 커져서 전체 비용이 더 비싼 경우가 많습니다.
  • 결론: 데이터가 매우 작을 때는 TOON 이 손해입니다.

2. "대량 생산"의 기회

하지만 데이터가 엄청나게 크고 복잡해지면 이야기가 달라집니다.

  • 비유: 우편물이 100 개, 1,000 개로 불어나면, TOON 의 간결함이 설명서 비용을 상쇄하고도 남습니다. 마치 "대량 생산 공장"처럼, 한 번 설정만 하면 그 이후로 엄청난 자원을 아낄 수 있습니다.
  • 결론: **단순한 리스트나 거래 내역 (주문서, 영수증)**처럼 규칙적인 데이터가 대량으로 쌓일 때 TOON 이 가장 빛을 발합니다.

3. 규칙의 양면성 (JSON-SO)

AI 가 실수하지 못하게 강제로 막는 방식 (JSON-SO) 은 작고 간단한 작업에서는 최고의 효율을 냅니다. 하지만 AI 가 너무 자유롭게 생각해야 하는 복잡한 추론 작업에서는 오히려 AI 의 능력을 제한해서 실수를 유발하기도 합니다.


🚀 요약 및 제언

이 논문은 **"TOON 이 무조건 최고는 아니다"**라고 말합니다.

  • ❌ TOON 을 쓰지 말아야 할 때:

    • 데이터가 작고 단순할 때.
    • 구조가 너무 복잡하고 꼬여 있을 때 (AI 가 혼란스러워함).
    • 실시간으로 즉석에서 한두 번만 처리할 때.
  • ✅ TOON 을 써야 할 때:

    • 수천, 수만 건의 데이터를 한 번에 처리할 때 (예: 은행 거래 내역, 로그 파일).
    • 데이터 구조가 규칙적이고 단순할 때.
    • 비용 절감이 최우선이고, 한 번 설정해두면 반복해서 사용할 때.

한 줄 요약:

"TOON 은 대량 생산용의 초간단 포장재입니다. 작은 선물 하나를 보낼 때는 비싸지만, 컨테이너 하나를 가득 채워 보낼 때는 최고의 효율을 냅니다."