원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기
Each language version is independently generated for its own context, not a direct translation.
상상해 보세요. 아주 똑똑하지만 약간 압도된 상태인 비서에게 일련의 지시를 전달하려고 한다고요.
문제: "JSON" 언어 장벽
현재 컴퓨터 프로그램들 (예: AI 에이전트) 이 보유한 도구들 (예: "웹 검색" 또는 "날씨 확인") 에 대해 서로 대화할 때, JSON이라는 형식을 사용합니다. JSON 은 컴퓨터가 빠르게 읽도록 설계된 경직되고 기술적인 문서 관리 시스템과 같습니다. 이는 대괄호, 따옴표, 반복적인 레이블로 가득 차 있습니다.
인간과 유사한 AI 모델, 특히 작고 빠른 모델들에게 이 JSON 을 읽는 것은 모든 단어가 무겁고 혼란스러운 플라스틱 케이스에 싸인 책을 읽으려는 것과 같습니다. AI 는 이 "플라스틱" (추가 기호와 구조) 에 너무 매몰되어 실제 지시를 잊어버립니다. 이 논문은 이를 "프로토콜 불일치"라고 부릅니다. AI 는 자연어 문장이 아닌 컴퓨터 파일을 읽으려 하고 있는 것입니다.
해결책: TSCG (번역가이자 편집자)
저자 푸르칸 사키즐리 (Furkan Sakizli) 는 TSCG(토큰 - 컨텍스트 시맨틱 문법) 라는 도구를 개발했습니다. TSCG 를 컴퓨터와 AI 사이에 자리 잡은 초고속 결정론적 편집자로 생각하세요.
AI 가 지시를 보기 전에 TSCG 는 지저분한 JSON 파일을 즉시 깔끔하고 자연스러운 텍스트 형식으로 다시 씁니다. 이는 방대한 법적 계약을 명확한 불릿 포인트 지시 목록으로 재작성하는 것과 같습니다.
작동 방식 (8 가지 "편집자")
TSCG 는 마법이나 추측을 사용하지 않습니다. 텍스트를 정리하기 위해 8 가지 특정 규칙 ( "연산자"라고 함) 의 고정된 세트를 사용합니다:
- 불필요한 장식을 제거합니다: "다음 항목들" 같은 정중한 표현이나 인간이 읽을 필요가 없는 중복 구절을 삭제합니다.
- 가구를 재배치합니다: AI 모델이 문장의 시작과 끝 (이야기의 "책장"과 같은) 에 가장 주의를 기울이므로, 지시의 가장 중요한 부분을 맨 앞과 맨 뒤로 이동시킵니다.
- AI 의 언어로 말합니다: AI 의 내부 사전이 여러 조각이 아닌 단일 "조각"으로 인식하는 기호로 변경하여 공간을 절약합니다.
결과: 소형 모델을 위한 기적
이 논문은 40 억에서 140 억 개의 "뇌 세포"를 가진 소형 모델부터 거대하고 최상위 모델에 이르기까지 12 가지 다른 AI 모델에서 이를 테스트했습니다.
- 소형 모델의 경우: 결과는 극적이었습니다. TSCG 없이는 20 가지 도구 목록을 제공받을 때 JSON 이 너무 혼란스러워 소형 모델이 거의 완전히 실패했습니다 (정확도 0%). TSCG 를 사용하면 정확도가 **84%**로 급등했습니다. 마치 AI 가 갑자기 "각성"하여 마침내 과제를 이해할 수 있게 된 것처럼요.
- 대형 모델의 경우: 초지능 모델조차도 더 나아졌습니다. 정확도가 높아지고 AI 사고 시간의 화폐인 "토큰" 사용량이 줄어들어 비용과 속도를 절약했습니다.
"아하!" 순간: 단순한 압축이 아닌 형식의 문제
이 논문에서 가장 흥미로운 발견 중 하나는 이것이 왜 작동하는지에 대한 이유입니다. 저자는 많은 소형 모델들에게 문제가 텍스트가 너무 길어서가 아니라 형식 (JSON) 이 적대자였다는 것을 깨달았습니다.
저자가 "JSON 텍스트"와 "일반 텍스트"(아무런 고급 압축 없이) 를 비교했을 때, 일반 텍스트만으로도 문제의 대부분이 해결되었습니다. TSCG 는 이의 궁극적인 버전입니다: 형식을 수정하고 텍스트를 압축합니다.
"일률적 적용" 신화
이 논문은 또한 모든 AI 모델이 동일하게 반응하지 않는다는 것을 발견했습니다.
- 일부 모델은 "배고픈" 모델입니다: TSCG 가 적용하는 모든 규칙을 좋아하며 모든 변경 사항마다 더 똑똑해집니다.
- 일부는 "민감한" 모델입니다: 일부 규칙은 좋아하지만 다른 규칙에는 혼란을 느낍니다. 너무 많은 변경 사항을 주면 실제로 성능이 떨어집니다.
- 일부는 "견고한" 모델입니다: 크게 상관하지 않으며 어떤 상황에서도 잘 작동합니다.
이는 모든 AI 에 대한 단일한 "완벽한" 설정이 없다는 것을 의미합니다. 사용하는 AI 에 따라 편집기를 조정해야 합니다.
요약하자면
TSCG 는 번역가 역할을 하는 무료 오픈 소스 도구입니다. 도구 정의의 경직되고 컴퓨터 전용 언어를 즉시 AI 모델이 실제로 이해할 수 있는 형식으로 변환합니다. 이를 통해 이전에 실패했던 실제 응용 분야에서 작고 저렴한 AI 모델이 효과적으로 작동할 수 있게 되며, 가장 큰 모델들도 더 빠르고 정확하게 만들어 줍니다. 이는 혼란스러운 문제에 대한 간단한 해결책입니다: AI 에게 컴퓨터 코드로 말하지 말고, 일반 텍스트로 말하기 시작하세요.
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.