PEPA: a Persistently Autonomous Embodied Agent with Personalities

Dit artikel introduceert PEPA, een cognitieve architectuur voor een fysieke agent die door middel van persoonlijkheidstrekken en een driedelig systeem autonoom doelen genereert en gedrag aanpast, waardoor het zonder externe instructies langdurig en zelfstandig kan opereren in dynamische omgevingen.

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een robot hebt die niet alleen een lijstje met taken afvinkt, maar eigenlijk leeft. Een robot die niet wacht tot je zegt "ga nu naar de keuken", maar zelf bedenkt: "Ik ben een beetje moe, ik ga even rusten," of "Ik ben nieuwsgierig, ik ga die nieuwe kamer verkennen."

Dat is precies wat de onderzoekers in dit papier hebben bedacht met PEPA. Laten we het uitleggen alsof we het over een levend wezen hebben, in plaats van over complexe code.

1. Het Probleem: Robots die als poppenkastfiguren werken

Tot nu toe gedragen robots zich als poppenkastfiguren. Ze doen alleen wat ze van tevoren hebben geleerd. Als je ze niet vertelt wat ze moeten doen, staan ze stil of doen ze iets willekeurigs. Ze hebben geen "wil" van binnen.

In de echte wereld is dat een probleem. Stel je een robot voor die een bejaardenzorg moet verzorgen of een planeet moet verkennen. Je kunt niet 24/7 bij hem in de buurt staan om te zeggen wat hij moet doen. Hij moet zelf kunnen beslissen: Wanneer moet ik eten (opladen)? Wanneer moet ik voorzichtig zijn? Wanneer moet ik iets nieuws proberen?

2. De Oplossing: Geef de robot een "Persoonlijkheid"

De onderzoekers zeggen: "Wat als we robots een persoonlijkheid geven, net als mensen?"

Stel je voor dat persoonlijkheid de DNA is van een robot.

  • Een avontuurlijke robot (zoals een hond die alles wil snuffelen) zal altijd nieuwe plekken opzoeken, zelfs als het een beetje riskant is.
  • Een voorzichtige robot (zoals een ouderwetse oma) zal liever op zijn plaats blijven en alleen bewegen als het 100% veilig is.
  • Een luie robot zal alles doen om energie te besparen en zo min mogelijk bewegen.

In plaats van dat de robot een vaste opdracht krijgt ("Ga naar kamer 3"), bepaalt zijn persoonlijkheid wat hij wil doen. De "wil" komt dus van binnen, niet van buitenaf.

3. Hoe werkt het? (De Drie Hersenen)

De robot heeft een slimme hersenstructuur met drie lagen, die samenwerken als een goed georganiseerd gezin:

  • Sys3 (De Dromer / De Chef): Dit is het deel dat de persoonlijkheid beheert. Het kijkt naar de herinneringen van de robot ("Gisteren viel ik bijna van de trap") en denkt na: "Vandaag moet ik voorzichtig zijn." Het bedenkt doelen voor de dag, zoals "Ik ga vandaag de zolder verkennen" of "Ik ga nu even rusten omdat mijn batterij laag is."
  • Sys2 (De Planner / De Strategist): Dit deel luistert naar de Dromer en bedenkt hoe hij die doelen bereikt. "Oké, ik moet de zolder op. Hoe kom ik daar? Via de lift of de trap? Welke route is het veiligst?" Het gebruikt slimme berekeningen om de beste route te kiezen.
  • Sys1 (De Lijf / De Uitvoerder): Dit is het fysieke deel: de wielen, de armen en de camera's. Het voert de bewegingen uit en kijkt wat er gebeurt. "Oeps, de trap is glad," of "Ik heb de knop van de lift gedrukt."

Het magische deel: Na elke dag kijkt de Dromer (Sys3) terug naar wat de Lijf (Sys1) heeft gedaan. Als de robot bijna zijn batterij leeg liep, denkt de Dromer: "Volgende keer moet ik eerder stoppen." Zo leert de robot van zijn eigen ervaringen en wordt hij elke dag een beetje slimmer en beter in zijn rol, zonder dat iemand hem opnieuw hoeft te programmeren.

4. Het Experiment: De Robot in het Kantoorgebouw

De onderzoekers hebben dit getest met een vierpotige robot (een robot-hond) in een echt kantoorgebouw met meerdere verdiepingen.

  • De Uitdaging: De robot moest zelfstandig liften nemen, trappen oplopen en beslissen wanneer hij moest stoppen om op te laden.
  • Het Resultaat:
    • De avontuurlijke robot liep overal rond, verkende elke hoek en deed veel nieuwe dingen.
    • De voorzichtige robot bleef dicht bij de startplek en deed alleen wat hij zeker wist.
    • De luie robot deed zo weinig mogelijk bewegingen om energie te sparen.

Bijzonder was dat de robot na een paar dagen "leren" veel beter werd. Op dag 1 vielen ze bijna allemaal uit door een lege batterij. Maar op dag 3, na hun eigen ervaringen te hebben verwerkt, wisten ze allemaal hun batterij te behouden en hun dag te overleven. Ze hadden zichzelf aangepast!

Samenvatting in één zin

PEPA is een robot die niet wacht op commando's, maar een eigen karakter heeft; hij droomt zijn eigen doelen, leert van zijn fouten en past zich aan, net als een levend wezen dat in de wereld probeert te overleven en te gedijen.

Het is alsof je een robot niet bouwt als een machine, maar opvoedt als een huisdier met een eigen karakter.