TSCG: Deterministic Tool-Schema Compilation for Agentic LLM Deployments

TSCG は、非効率的な JSON スキーマをトークン効率の高い構造化テキストに変換することで、現在のツール使用失敗の大部分を引き起こしている形式の不一致を解決し、本番環境における小規模および最先端の LLM のツール使用精度を大幅に向上させる、決定論的かつ依存関係ゼロのツールスキーマコンパイラです。

原著者: Furkan Sakizli

公開日 2026-05-07
📖 1 分で読めます☕ さくっと読める

原著者: Furkan Sakizli

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 これは以下の論文のAI生成解説です。著者が執筆または承認したものではありません。技術的な正確性については原論文を参照してください。 免責事項の全文を読む

Each language version is independently generated for its own context, not a direct translation.

非常に賢いものの、少し圧倒されがちなアシスタントに、一連の指示を与えようとしている状況を想像してみてください。

問題点:「JSON」という言語の壁
現在、コンピュータプログラム(AI エージェントなど)が、自分が持っているツール(「ウェブを検索する」や「天気を確認する」など)について互いに話す際、JSONと呼ばれる形式を使用します。JSON は、コンピュータが素早く読み取れるように設計された、硬直的で技術的な文書管理システムのようなものです。括弧、引用符、そして繰り返されるラベルで溢れています。

人間のような AI モデル、特に小さく高速なモデルにとって、この JSON を読むことは、すべての単語が重く混乱を招くプラスチックケースに包まれた本を読もうとするようなものです。AI はその「プラスチック」(余分な記号や構造)にあまりにも引きずり込まれてしまい、実際の指示を忘れてしまいます。この論文ではこれを「プロトコルの不一致」と呼んでいます。AI は自然言語の文章ではなく、コンピュータのファイルを読もうとしているのです。

解決策:TSCG(「翻訳者」かつ「編集者」)
著者のフルカン・サキズリは、TSCG(Token-Context Semantic Grammar)と呼ばれるツールを開発しました。TSCG は、コンピュータと AI の間に位置する、超高速で決定論的な編集者だと考えてください。

AI が指示を見る前に、TSCG はごちゃごちゃした JSON ファイルを即座に、清潔で自然な響きのテキスト形式に書き換えます。これは、密度の高い法的契約書を、明確な箇条書きの指示リストに書き換えるようなものです。

仕組み(8 人の「編集者」)
TSCG は魔法や推測を使用しません。テキストを整理するために、8 つの特定のルール(「演算子」と呼ばれる)の固定セットを使用します。

  1. 不要なものを除去する:「以下の項目」のような丁寧な言葉や、人間が読む必要のない冗長なフレーズを削除します。
  2. 家具を配置し直す:指示の最も重要な部分を文の最初と最後に移動させます。AI モデルは文の最初と最後に最も注意を払うためです(物語の「ブックエンド」のようなものです)。
  3. AI の言語で話す:記号を、AI の内部辞書が複数の破片ではなく単一の「チャンク」として認識するものに変更し、スペースを節約します。

結果:小型モデルにとっての奇跡
この論文では、40 億から 140 億の「脳細胞」を持つ小型モデルから、巨大なトップクラスのモデルまで、12 種類の異なる AI モデルでテストが行われました。

  • 小型モデルの場合:結果は劇的でした。TSCG なしでは、20 個のツールのリストを与えられた際、JSON があまりにも混乱を招くため、小型モデルはほぼ完全に失敗していました(精度 0%)。TSCG を使用すると、その精度は**84%**まで跳ね上がりました。まるで AI が突然「目覚め」、ようやくタスクを理解できるようになったかのようです。
  • 大型モデルの場合:超賢いモデルさえも改善されました。それらはより正確になり、AI の思考時間の通貨である「トークン」の使用量を減らし、コストと速度の面で節約になりました。

「ひらめき」の瞬間:圧縮だけでなく、形式の問題である
この論文で最も興味深い発見の一つは、なぜこれが機能するのかという理由です。著者は、多くの小型モデルにとって、問題が単にテキストが長すぎることではなく、形式(JSON)自体が敵であったことに気づきました。

著者が「JSON テキスト」と「特別な圧縮なしのプレーンテキスト」を比較したところ、プレーンテキスト単体で問題の大部分が解決しました。TSCG はその究極のバージョンです。形式を修正し、かつテキストを圧縮します。

「万能」の神話
この論文はまた、すべての AI モデルが同じように反応するわけではないことを発見しました。

  • 一部のモデルは**「欲張り」**です:TSCG が適用するすべてのルールを好み、すべての変更で賢くなります。
  • 一部のモデルは**「敏感」**です:いくつかのルールは好みますが、他のルールには混乱します。変更が多すぎると、実際にはパフォーマンスが悪化します。
  • 一部のモデルは**「堅牢」**です:あまり気にしません。何があってもよく機能します。

これは、すべての AI に適用できる単一の「完璧な」設定が存在しないことを意味します。使用する AI に応じて、編集者を調整する必要があります。

要約
TSCG は、翻訳者として機能する無料のオープンソースツールです。ツールの定義に関する、硬直的でコンピュータ専用の言語を即座に、AI モデルが実際に理解できる形式に変換します。これにより、以前は失敗していた実世界でのアプリケーションにおいて、より小さく安価な AI モデルが効果的に機能できるようになり、また最大のモデルをより高速かつ正確にします。これは混乱した問題に対するシンプルな解決策です。AI にはコンピュータコードで話しかけるのをやめ、プレーンテキストで話しかけ始めることです。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →