HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

本文提出了 HAMLET 框架,这是一种基于大语言模型的分层自适应多智能体系统,能够根据简单主题自动生成剧本蓝图,并通过具备情感记忆与物理交互能力的智能体实现沉浸式、自主的实时互动戏剧表演,同时引入了专用评估模型 HAMLETJudge 以客观衡量演出质量。

Shufan Jiang, Sizhou Chen, Chi Zhang, Xiao-Lei Zhang, Xuelong Li

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 HAMLET 的超级智能系统,它的目标非常宏大:让 AI 不仅能写剧本,还能像真人演员一样,在舞台上“活”起来,和你一起即兴演出一场沉浸式的戏剧。

想象一下,你不需要是编剧,也不需要懂复杂的指令,只要给 AI 一个简单的主题(比如“哈姆雷特复仇”或者“两个侦探在咖啡馆破案”),HAMLET 就能在几分钟内为你呈现一场有血有肉、甚至能和你互动的现场演出。

为了让你更容易理解,我们可以把 HAMLET 比作一个**“超级智能剧团”**,它的工作流程分为两个阶段:

第一阶段:排练室(离线规划)

—— 就像导演在开剧本研讨会

在正式演出前,HAMLET 不会急着上台,而是先在一个“排练室”里忙碌。这里有一个由不同 AI 专家组成的**“编剧天团”**:

  • 角色设计师:负责给每个演员(AI 角色)写小传。比如,哈姆雷特是个忧郁的王子,克劳狄斯是个阴险的叔叔。他们不仅知道名字,还知道角色的性格、秘密和人际关系。
  • 剧情设计师:负责构思故事大纲。他们不会把故事写死,而是画出一张“寻宝地图”,标出关键节点(比如“必须发现真相”、“必须有人离开”),但具体怎么走,留给演员发挥。
  • 审查员:像个挑剔的剧评人,检查角色逻辑通不通,剧情有没有漏洞。
  • 总导演:最后把所有人的想法整合成一份**“演出蓝图”**。

关键点:以前的 AI 写故事,要么需要你把整个故事大纲都写好,要么写出来的东西像流水账。HAMLET 只需要一个主题,就能自动生成这份蓝图,既保证了故事不跑偏,又给演员留足了即兴发挥的空间。

第二阶段:舞台现场(在线表演)

—— 演员们真的“活”了

当演出开始,HAMLET 的 AI 演员们就登场了。这时候,他们不再是只会背台词的机器,而是拥有**“大脑”“身体”**的演员。

1. 拥有“双重大脑”的演员 (PAD 模块)

这是 HAMLET 最厉害的地方。以前的 AI 演员,别人问一句,他答一句,像个被动的机器人。
HAMLET 给每个演员装了一个叫 PAD (感知与决策) 的模块,这就像人类大脑的**“快思考”“慢思考”**:

  • 快思考 (System I):遇到突发状况(比如有人骂你),本能地生气回击。
  • 慢思考 (System II):遇到复杂局面(比如要设个局陷害对手),先在心里盘算一下:“我现在假装生气,其实是为了让他放松警惕,下一步再抓他。”
  • 甚至能“沉默”:有时候,不说话比说话更有力。PAD 能让演员决定“此时无声胜有声”,或者做一个动作(比如冷笑、摔杯子)来代替说话。

比喻:以前的 AI 演员是提线木偶,你拉一下线它动一下;HAMLET 的演员是即兴喜剧大师,他们有自己的性格、记忆和目的,能主动推动剧情,甚至和你(观众/玩家)斗智斗勇。

2. 真的能“动手” (具身交互)

戏剧不仅仅是说话,还要有动作。HAMLET 的演员真的能改变舞台环境

  • 如果演员想“打开信”,系统会真的把信的状态从“未读”变成“已读”。
  • 如果演员想“拿起武器”,系统会确认武器是否存在,并更新场景。
  • 有一个**“旁白员” (Narrator)** 像个严格的裁判,专门负责判断动作合不合理。比如,如果演员试图在舞台上“飞”,旁白会直接判“失败”,因为这是现实题材,不能飞。这保证了演出的真实感。

3. 防止冷场的“救场员” (Advancer)

如果演员们聊嗨了,或者卡住了,剧情停滞不前怎么办?
HAMLET 有一个**“救场员”**。它时刻盯着剧情进度条,如果发现某个关键情节(比如“凶手必须被揭露”)迟迟没发生,它就会悄悄给演员发指令:“嘿,该你行动了,快把那个证据拿出来!”确保故事永远在向前推进,不会变成尴尬的闲聊。

怎么评价演得好不好?(HAMLETJudge)

以前评价 AI 写故事,主要看文字通不通顺。但戏剧好不好,得看**“戏味儿”够不够。
HAMLET 训练了一个专门的
“毒舌评委” (HAMLETJudge)**。它不看单句台词,而是看整场戏:

  • 角色像不像:哈姆雷特是不是真的忧郁?
  • 故事精不精彩:有没有反转?有没有悬念?
  • 互动爽不爽:观众(或玩家)能不能沉浸其中?

总结

HAMLET 就像是一个全自动的“元宇宙剧团”

  • 它不需要你写剧本,只要给个主题。
  • 它里面的演员有性格、有记忆、会思考、会演戏,甚至能和你互动。
  • 它能让你感觉不是在和电脑对话,而是在看一场活生生的、随时可能发生意外(但又在情理之中)的现场戏剧

这篇论文的核心贡献就是:它让 AI 从“只会说话的文本生成器”,进化成了“能感知环境、能主动决策、能即兴表演的数字演员”,让交互式戏剧真正变得可行且迷人。