Ares: Adaptive Reasoning Effort Selection for Efficient LLM Agents

本文提出了 Ares 框架,通过轻量级路由器为多步代理任务中的每个步骤动态选择最低所需的推理强度,在显著降低推理成本(最高减少 52.7% 的推理 token 使用)的同时保持了任务成功率。

Jingbo Yang, Bairu Hou, Wei Wei, Yujia Bao, Shiyu Chang

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 ARES 的新框架,它的核心目的是让 AI 智能体(AI Agents)变得更聪明、更省钱。

为了让你轻松理解,我们可以把 AI 智能体想象成一个正在执行复杂任务的“超级员工”,而 ARES 就是这位员工的**“智能精力管理教练”**。

1. 背景:为什么现在的 AI 太“烧钱”了?

现在的 AI(特别是那些会“思考”的模型)在做任务时,比如帮你订机票、查资料或浏览网页,它们每一步都会进行大量的“内心独白”(也就是推理过程)。

  • 现状:为了不出错,人们通常让 AI 在每一步都开启“深度思考模式”(High Effort)。这就像让一个员工在“打开电脑”、“点击鼠标”这种简单动作上,也花 10 分钟去写一份详细的分析报告。
  • 问题
    • 太慢太贵:这种“全程高配”模式消耗了大量的计算资源(Token),就像一直开着法拉利的引擎去送快递,既费油又没必要。
    • 效果不佳:如果为了省钱,让 AI 在每一步都开启“快速模式”(Low Effort),就像让一个新手在“处理复杂合同”这种关键步骤上也只花 1 秒钟,结果就是错误百出,任务失败。

2. ARES 的解决方案:像“老司机”一样灵活变通

ARES 的核心思想是:不要一刀切,要“看菜吃饭”

它引入了一个轻量级的**“路由教练”(Router)**。这个教练不直接干活,它的任务是根据当前的情况,决定 AI 员工下一步该用多少“脑力”。

生动的比喻:

想象你在玩一个大型探险游戏

  • 简单步骤(如:打开地图、点击“开始”按钮):
    • 传统做法:全程开启“上帝视角 + 超级分析”(高成本)。
    • ARES 做法:教练喊一声:“这步很简单,快速通过!”(低脑力,省资源)。
  • 困难步骤(如:在复杂的迷宫里找路、解开一个逻辑谜题):
    • 传统做法:如果全程快速,可能会走错路,导致游戏失败。
    • ARES 做法:教练看到前方有陷阱,立刻喊:“注意!这里很危险,开启深度思考模式,仔细分析!”(高脑力,保成功)。

ARES 就是那个能实时判断“哪里该快,哪里该慢”的教练。

3. ARES 是怎么学会这个技能的?(训练过程)

这个“教练”不是天生的,它是通过三个阶段“特训”出来的:

  1. 收集“完美通关”录像(轨迹收集)
    先让 AI 用“最顶级配置”(高脑力)把任务完美做完,记录下成功的路线。这就好比先让一个特级大厨做出一道完美的菜,作为标准答案。

  2. 拆解步骤,寻找“最低配置”(标注努力程度)
    教练把这道完美的菜拆解成一个个步骤。对于每一步,它尝试问:“如果我只用‘普通厨师’(低脑力)来做这一步,能成功吗?”

    • 如果“普通厨师”也能切好菜,那就标记为“低脑力”。
    • 如果只有“特级厨师”才能处理好复杂的摆盘,那就标记为“高脑力”。
    • 目的:找出每一步完成所需的最低脑力门槛。
  3. 让教练学会“解释原因”(生成理由)
    为了让教练更聪明,不仅让它选“高/低”,还让它先说出为什么这么选(比如:“因为这一步涉及复杂逻辑,所以必须高脑力”)。这就像让教练在发号施令前,先写个简短的“作战计划”,这样它做决定时更准确。

  4. 实战演练与奖励(强化学习)
    最后,让教练在模拟环境中不断试错。

    • 如果任务成功了且省了钱,给奖励。
    • 如果为了省钱导致任务失败,或者浪费钱,就惩罚。
    • 经过成千上万次的练习,教练就学会了如何在保证成功的前提下,极致地节省成本

4. 效果如何?(实验结果)

论文在三个不同的领域测试了 ARES:

  • 工具使用(如订机票、查数据库)
  • 深度研究(如搜索复杂信息)
  • 网页浏览(如在网上购物、操作网站)

结果令人惊喜:

  • 省钱:相比全程开启“高脑力”模式,ARES 减少了 35% 到 52% 的计算成本(Token 消耗)。
  • 保质:任务的成功率几乎没有下降,甚至在某些情况下(如网页浏览),因为避免了“过度思考”导致的混乱,成功率反而更高了!
  • 通用性:这个教练不仅能在小模型上工作,还能“迁移”到大模型上,依然有效。

5. 总结:这对我们意味着什么?

ARES 就像给 AI 装上了一个“智能节能开关”。

以前,我们要么让 AI 全程“烧脑”(太贵),要么全程“摸鱼”(太蠢)。现在,ARES 让 AI 学会了**“该省则省,该花则花”**。

  • 对于开发者:这意味着可以用更少的钱,部署更强大的 AI 应用。
  • 对于我们用户:未来的 AI 助手反应会更快,而且因为成本降低,使用费用可能会更便宜,同时依然能帮你解决复杂的难题。

简单来说,ARES 让 AI 从“只会死磕的学霸”变成了“懂得劳逸结合的聪明人”。