原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
Each language version is independently generated for its own context, not a direct translation.
想象一下,你正在给一位非常聪明但略显不知所措的助手提供一套指令。
问题:"JSON"语言障碍
目前,当计算机程序(如 AI 智能体)彼此交流它们拥有的工具(例如“搜索网络”或“查询天气”)时,它们使用一种称为JSON的格式。JSON 是一种专为计算机快速读取而设计的、僵化的技术归档系统。它充满了括号、引号和重复的标签。
对于类人 AI 模型,尤其是那些更小、更快的模型来说,阅读这种 JSON 就像试图阅读一本每个单词都被包裹在沉重、令人困惑的塑料壳中的书。AI 被这些“塑料”(额外的符号和结构)拖得如此疲惫,以至于忘记了实际的指令。这篇论文将这种现象称为“协议不匹配”。AI 试图读取的是计算机文件,而不是自然语言句子。
解决方案:TSCG(“翻译器”与“编辑”)
作者 Furkan Sakizli 开发了一种名为TSCG(Token-Context Semantic Grammar,Token 上下文语义语法)的工具。你可以将 TSCG 想象成一个超快速、确定性的编辑程序,它位于计算机和 AI 之间。
在 AI 看到指令之前,TSCG 会将杂乱的 JSON 文件瞬间重写为干净、听起来自然的文本格式。这就像将一份冗长的法律合同重写为清晰的项目符号指令列表。
工作原理(8 位“编辑”)
TSCG 不使用魔法或猜测。它使用一组固定的 8 条特定规则(称为“算子”)来清理文本:
- 去除废话:它删除了诸如“以下项目”之类的礼貌用语,或删除人类无需阅读的冗余短语。
- 重新布置家具:它将指令中最重要的部分移至开头和结尾,因为 AI 模型最关注句子的首尾(就像故事的“书挡”)。
- 说 AI 的语言:它将符号更改为 AI 内部词典识别为单个“块”而非多个破碎片段的符号,从而节省空间。
结果:小模型的奇迹
该论文在 12 种不同的 AI 模型上测试了这种方法,从小型模型(40 亿到 140 亿个“脑细胞”)到顶级的巨型模型。
- 对于小型模型:结果令人瞩目。在没有 TSCG 的情况下,当给定包含 20 个工具的列表时,小型模型几乎完全失败(准确率为 0%),因为 JSON 过于令人困惑。有了 TSCG,它们的准确率跃升至84%。这就像 AI 突然“苏醒”过来,终于能够理解任务了。
- 对于大型模型:即使是超级聪明的模型也表现更好。它们变得更加准确,并使用了更少的"Token"(AI 思考时间的货币),从而节省了成本并提升了速度。
“顿悟”时刻:关键在于格式,而不仅仅是压缩
该论文中最有趣的发现之一是它为何有效。作者意识到,对于许多小型模型而言,问题不仅仅在于文本太长;而是格式(JSON)本身就是敌人。
当作者比较"JSON 文本”与“纯文本”(没有任何 fancy 压缩)时,仅凭纯文本就解决了大部分问题。TSCG 是这一点的终极版本:它既修复了格式,又压缩了文本。
“一刀切”的神话
该论文还发现,并非所有 AI 模型的反应都一样。
- 有些模型是“饥饿型”:它们喜欢 TSCG 应用的每一条规则,并且随着每一次改变而变得更聪明。
- 有些是“敏感型”:它们喜欢某些规则,但会被其他规则搞糊涂。如果你给它们太多改变,它们的表现反而会变差。
- 有些是“稳健型”:它们不太在意;无论怎样,它们都能很好地工作。
这意味着不存在适用于所有 AI 的单一“完美”设置。你必须根据所使用的 AI 来调整编辑器。
总而言之
TSCG 是一个免费、开源的工具,充当翻译器。它将工具定义的僵化、仅限计算机的语言瞬间转换为 AI 模型实际能够理解的格式。这使得更小、更便宜的 AI 模型能够在它们此前失败的现实世界应用中有效工作,同时也让最大的模型变得更快、更准确。这是一个针对令人困惑问题的简单修复方案:停止用计算机代码与 AI 对话,开始用纯文本与它对话。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。