From Logs to Agents: Reconstructing High-Level Creative Workflows from Low-Level Raw System Traces

该论文提出了一种将 AI 创意工具产生的低级别系统日志转化为高级别结构化行为工作流的方法,旨在通过抽象关键行为令牌来解析用户创意意图,从而为能够理解工作流程并辅助决策的“过程感知智能体”奠定基础。

Tae Hee Jo, Kyung Hoon Hyun

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在教我们如何把“乱糟糟的厨房监控录像”整理成“大厨的烹饪心路历程”

想象一下,你正在观察一位大厨(用户)在厨房里做一道复杂的创意菜(使用 AI 设计工具)。

1. 问题:我们只看到了“噪音”,没看到“意图”

现在的 AI 设计工具(比如 ComfyUI 这种节点式工具)非常强大,但它们太“话痨”了。

  • 现状:当你记录大厨的动作时,系统会生成海量的“低级别日志”。这就像监控摄像头记录了每一秒:“手伸向冰箱”、“打开冰箱门”、“拿了一瓶酱油”、“把酱油放回”、“擦了一下桌子”、“系统自动清理了案板上的碎屑”……
  • 痛点:这些记录里充满了噪音。比如,系统自动清理垃圾、后台重新连接线路,这些都不是大厨的“创意决定”,只是机器在干活。如果我们直接看这些原始数据,就像看着一堆乱码,完全看不懂大厨到底想做什么,更不知道他为什么这么做。

2. 解决方案:把“监控录像”剪辑成“精彩纪录片”

作者提出了一套三步走的方法,把那些乱糟糟的原始数据,变成人类和 AI 都能看懂的“创意工作流”。

第一步:去噪与分类(像剪辑师一样筛选)

  • 做法:他们写了一个智能过滤器,把那些“机器自动干的杂活”(比如清理缓存、后台重连)全部删掉。
  • 保留什么:只保留真正代表大厨创意决策的动作。他们把这些动作归纳为四种“高级语言”:
    • 插入 (INSERT):大厨把新食材(图片/提示词)放进锅里。
    • 修改 (MODIFY):大厨调整火候、加调料(修改提示词、调整参数)。
    • 生成 (GENERATION):大厨按下“开始烹饪”按钮,让 AI 模型出菜。
    • 移除 (REMOVE):大厨觉得这道菜不行,倒进垃圾桶。
  • 效果:原本 900 多条乱七八糟的记录,被精简成了 500 多条真正有意义的“创意步骤”。

第二步:重构工作流(画出“思维导图”)

  • 做法:创意往往不是直线的,而是像树枝一样分叉的。大厨可能试了 A 方案,觉得不行,又回到原点试 B 方案。
  • 可视化:作者把这些步骤画成了一个有向无环图(DAG)
    • 这就好比给大厨的烹饪过程画了一张家族树
    • 你可以清楚地看到:哪条分支是“尝试了 5 次都没成功”,哪条分支是“最终选定的完美方案”。
    • 这让我们不再只看“时间先后”,而是看懂了“逻辑脉络”。

第三步:翻译代码(变成通用语言)

  • 做法:把上面的图形转换成标准的“单词”(Token)。
    • 比如把“在图片节点上调整了参数”翻译成 MODIFY_image
  • 好处:不管大厨用的是哪个牌子的锅(不同的设计软件),只要翻译成这些标准单词,我们就能分析出通用的烹饪规律。

3. 为什么要这么做?为了培养“懂你的 AI 助手”

这是这篇论文最酷的地方。现在的 AI 助手就像个失忆的实习生

  • 现状:你让它改个图,它只盯着你当前的这张图看。如果你改错了,它不知道你是因为刚才试了 10 次都不行才改的,它只会机械地执行。
  • 未来(Process-Aware Agents):有了这套方法,AI 助手就拥有了**“长期记忆”“过程意识”**。
    • 预测意图:AI 发现你刚“插入”了一张图,根据历史数据(69.6% 的概率),它知道下一秒你大概率要“修改”它。于是它可能会主动问:“需要我帮你自动调整尺寸吗?”
    • 解释原因:如果你问“为什么选这个?”,AI 不再瞎编,而是能看着你的“工作流树”说:“因为你之前尝试了 3 种不同的光影效果都不满意,所以这次你选择了更柔和的参数。”
    • 提供建议:它甚至能告诉你:“以前像你这样操作路径的大厨,最后都成功做出了这种风格的菜,你要不要试试?”

总结

这篇论文的核心思想就是:不要只盯着机器生成的“原始数据”,要把它翻译成人类的“创意故事”。

只有当 AI 不仅能看到用户“现在在做什么”,还能读懂用户“是怎么走到这一步的”以及“为什么这么做”时,它才能从一个冷冰冰的执行工具,进化成一个真正懂你、能和你并肩作战的创意伙伴