PEPA: a Persistently Autonomous Embodied Agent with Personalities

本論文は、外部からの指示に依存せず、人格特性を内生的な組織原理として活用し、自律的に目標を生成・進化させることで、動的な環境における永続的な自律性を達成する新しい認知アーキテクチャ「PEPA」を提案し、実世界のロボットによる実証実験を通じてその有効性を立証したものである。

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang

公開日 2026-03-10
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「PEPA(ペパ)」**という、まるで生き物のように「自分自身で考えて、長生きし、成長するロボット」の仕組みを紹介したものです。

これまでのロボットは、人間が「ここに行って、あれを取って」と命令を出さないと動きませんでした。でも、PEPA は違います。人間が何も言わなくても、**「自分の性格」**という内なる羅針盤に従って、何をするべきかを自分で決め、毎日反省して成長し続けます。

まるで**「ロボット版のペット」「自立したルームメイト」**のような存在です。

以下に、難しい専門用語を使わず、身近な例え話で解説します。


1. 従来のロボット vs. PEPA:「お人形」vs「生き物」

  • これまでのロボット(お人形):
    人間が「おもちゃ箱を片付けなさい」という命令(脚本)を与えないと動けません。命令が終われば、ただそこに座り込んでしまいます。もし予期せぬことが起きれば、パニックになって止まってしまいます。
  • PEPA(生き物):
    人間が命令しなくても、「自分の性格」(例えば「好奇心旺盛」「慎重」「怠け者」など)に基づいて、自分から「今日は部屋を探索しよう」「疲れたから休もう」と考えます。
    • 例え話:
      従来のロボットは、**「お芝居の台本通りに動く人形」です。
      PEPA は、
      「自分の性格を持った実在の犬」**です。犬は「散歩に行きたい」「お腹が空いた」「怖いから逃げたい」という気持ちを自分で持って行動しますよね。PEPA もそれと同じです。

2. PEPA の頭脳:3 つのシステムが協力する「脳」

PEPA の頭の中は、3 つの役割を持ったチームに分かれています。

① Sys3(性格と目標を作る「大脳」)

  • 役割: 「私は誰か?」「今日は何をするべきか?」を決めます。
  • 仕組み:
    • 性格(Personality): ユーザーが「私は好奇心旺盛で、でも少し臆病な犬です」と設定すると、その性格が「内なる声」となって行動を導きます。
    • 記憶と反省(Reflection): 一日の終わりに、その日の出来事(失敗したり成功したりしたこと)を思い出して、「明日はもっと慎重にしよう」と目標を調整します。
    • 例え話:
      これは**「人生のコーチ兼、日記を書く自分」**です。朝起きて「今日は元気だから探索しよう」と決め、夜には「あ、昨日は転びそうになったから、今日は慎重にしよう」と反省して明日の計画を立てます。

② Sys2(計画を立てる「知性」)

  • 役割: 「Sys3 が決めた目標」を「具体的にどう動くか」に翻訳します。
  • 仕組み:
    • 性格(内なる欲求)と、外の環境(エレベーターがある、階段がある)の情報を組み合わせて、最適な行動プランを考えます。
    • 例え話:
      これは**「優秀な秘書」**です。「社長(Sys3)が『今日は新しい場所を探検したい』と言ったから、エレベーターのボタンを押す手順を考え、階段の登り方を確認して、安全に実行するプランを立てる」という役割です。

③ Sys1(体を動かす「手足と感覚」)

  • 役割: 実際に体を動かし、感覚を記録します。
  • 仕組み:
    • 四足歩行ロボット(犬のようなロボット)の足や腕を動かします。
    • 転びそうになったら止まったり、バッテリーが少なくなったら充電場所を探したりします。
    • 全ての行動を「経験」として記録し、Sys3 に返します。
    • 例え話:
      これは**「体そのもの」**です。足で階段を登り、手でエレベーターのボタンを押します。もし転びそうになったら「痛い!」と叫び(警告を出し)、その経験を「日記」に書き留めます。

3. 実際の活躍:オフィスビルで「自立」する

研究者たちは、この PEPA を実際の四足歩行ロボットに搭載し、複雑なオフィスビルでテストしました。

  • エレベーターの操作:
    人間がボタンを押すのを待つのではなく、自分でエレベーターを探し、ボタンを押し、中に入って階を選べます。
  • 階段の登り降り:
    階段はロボットにとって難しいですが、PEPA は「高さ」に合わせて地図を調整し、転ばずに登り降りできました。
  • 性格による違い:
    • 「怠け者」のロボット: すぐに休憩を取り、エネルギーを節約します。
    • 「好奇心旺盛」のロボット: 広い範囲を探索しますが、バッテリーが少なくなると「もう帰ろう」と判断します。
    • 「慎重」なロボット: 危険な場所には近づかず、安全を最優先します。

4. 最大の成果:「反省」による成長

この研究の一番すごいところは、**「失敗から学んで、性格に合わせて成長する」**点です。

  • 1 日目: 全員がバッテリー切れで倒れてしまいました(失敗)。
  • 2 日目: 前の日の失敗を「Sys3」が反省し、「もっと早く充電しよう」と目標を修正しました。
  • 3 日目: 全員がバッテリーを温存しながら、24 時間動き続けられました。

まるで**「子供が転んで痛かったから、次は転ばないように歩くようになる」**ような、自然な成長プロセスを実現しました。

まとめ:なぜこれが重要なのか?

これからのロボットは、病院で患者さんの世話をするとか、惑星探査をするなど、人間が常に指示を出せない場所で働く必要があります。

PEPA は、**「性格」**という人間らしい要素を取り入れることで、ロボットが「指示待ち」から「自分勝手に(でも責任を持って)生きる」存在へと進化することを示しました。

一言で言えば:

「PEPA は、自分の性格を持ち、失敗から学び、人間のように『生きている』感覚で、長い間、自律的に動き続けるロボットです。」

これにより、ロボットは単なる機械ではなく、私たちが一緒に暮らせる「パートナー」になれるかもしれません。