PEPA: a Persistently Autonomous Embodied Agent with Personalities

本文提出了 PEPA,一种通过三层认知架构利用人格特质作为内在组织原则,使具身智能体能够在无需外部任务指令的情况下自主生成目标并实现持久自主运行的机器人系统。

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 PEPA 的机器人系统。简单来说,它不是那种只会听指令干活的“机器仆人”,而是一个拥有自己性格、能自己找事做、并且能在漫长岁月中不断进化的“数字生命体”。

为了让你更容易理解,我们可以把 PEPA 想象成一个住在你家里的“机器狗”,但它和普通的扫地机器人或遥控狗完全不同。

1. 核心问题:以前的机器人太“听话”了

  • 现状:现在的机器人就像提线木偶。主人说“去拿杯子”,它就去拿;主人不说,它就发呆。如果主人不在,或者环境变了(比如杯子不见了),它们就不知道该怎么办了。
  • PEPA 的突破:PEPA 想要像真实的动物一样。就像你的猫,即使没人命令,它也会因为“好奇”去抓老鼠,或者因为“懒惰”在沙发上睡觉。它不需要你时刻下达指令,它自己就有内在的动力

2. 核心秘密:给机器人装个“性格”

论文认为,要让机器人长期独立工作,必须给它注入性格

  • 比喻:想象一下,如果给机器人设定不同的“性格剧本”:
    • 好奇宝宝型:它会像探险家一样,喜欢到处乱跑,看看新地方,哪怕有点累也愿意。
    • 谨慎老成型:它会像一位守财奴,非常在意电量,只敢在安全范围内活动,绝不冒险。
    • 勤劳工作型:它会像一位苦行僧,只要电量够,就拼命干活,直到累倒。
  • 作用:这种性格不是写死的代码,而是像基因一样,决定了机器人“看重什么”(比如看重探索还是看重安全),从而让它自己决定“接下来该做什么”。

3. 大脑架构:三层“大脑”如何协作?

PEPA 的大脑分成了三层,就像一个公司的运作模式:

  • 第三层(Sys3):CEO 兼心理医生
    • 任务:它负责定目标反思
    • 怎么工作:每天早上,它会看看昨天的日记(记忆),结合自己的性格(比如“我是个爱冒险的人”),决定今天该干什么。
    • 进化:如果昨天探险时差点没电了,它会反思:“哎呀,太冒险了,今天得保守点。”这就是自我进化
  • 第二层(Sys2):项目经理
    • 任务:负责做计划
    • 怎么工作:CEO 说“今天去探索”,项目经理就会想:“怎么去?走哪条路?会不会撞墙?”它利用大语言模型(LLM)来制定具体的行动路线。
  • 第一层(Sys1):手脚和感官
    • 任务:负责干活记录
    • 怎么工作:它是机器人的身体,负责走路、按电梯按钮、看路。最重要的是,它会把发生的一切(成功了还是失败了,累不累)像写日记一样记下来,反馈给 CEO。

4. 真实世界测试:一只在写字楼里“流浪”的机器狗

研究人员把 PEPA 装在一个四足机器狗(Unitree Go2)身上,放在真实的办公楼里测试。

  • 挑战:它需要自己坐电梯、爬楼梯、在不同楼层间穿梭,还要自己看电量,防止没电“死机”。
  • 电梯与楼梯
    • 它学会了怎么按电梯按钮(像人一样)。
    • 它发明了一种**“高度对齐”的地图技术**。普通的机器人爬楼梯容易晕,因为楼梯是斜的。PEPA 的算法能像穿山甲一样,根据楼梯的坡度实时调整视角,稳稳地上下楼。
  • 性格大比拼
    • 研究人员设定了 5 种不同性格的机器狗。
    • 结果:性格不同的狗,行为真的不一样!
      • 懒惰狗:电量低了就立刻躺平睡觉,绝不乱跑。
      • 好奇狗:即使电量低,也会忍不住多走两步看看新风景,但最后也能学会在危险前刹车。
      • 谨慎狗:全程都在安全区打转,几乎不冒险。
    • 自我进化:第一天,很多机器狗因为太鲁莽没电了。但经过几天的“反思日记”(Sys3 的更新),它们都学会了如何在保持性格的同时,更好地保护自己,最后都能坚持 24 小时不“死机”。

5. 总结:这意味着什么?

这篇论文告诉我们,未来的机器人不需要我们时刻拿着遥控器指挥。

  • 我们可以给它们设定性格(比如“我想养一只爱探险的狗”)。
  • 它们会根据自己的性格,自己决定去哪里玩、什么时候休息。
  • 它们会通过每天的经历来学习,变得越来越聪明,越来越适应环境。

一句话总结:PEPA 让机器人从“听话的机器”变成了“有性格、能思考、会成长的数字生命”,这是实现真正长期自主机器人的关键一步。