Integrating Personality into Digital Humans: A Review of LLM-Driven Approaches for Virtual Reality

Each language version is independently generated for its own context, not a direct translation.

De Digitale Mens met een Ziel: Hoe AI en Virtual Reality Samenkomen

Stel je voor dat je een bril opzet en je bevindt je in een virtuele wereld. In plaats van alleen maar naar statische beelden te kijken, loop je daar rond met digitale mensen. Maar hier is het probleem: tot nu toe voelen deze digitale figuren vaak als robots. Ze spreken met een vaste stem, hun gebaren zijn voorspelbaar en ze hebben geen echte persoonlijkheid. Het is alsof je met een pop praat die alleen de woorden van een script kan zeggen.

Dit artikel, geschreven door een team van onderzoekers, kijkt naar hoe we die robots kunnen veranderen in echte, levendige personages met een eigen karakter, gevoelens en een unieke persoonlijkheid. Ze doen dit door een slimme technologie te gebruiken die we LLM's (Large Language Models) noemen.

Hier is hoe ze dat doen, uitgelegd met een paar simpele vergelijkingen:

1. De Brein-Upgrade: Van Script naar Improvisatie

Vroeger waren digitale personages als een poppenkastpop. Je trok aan een touwtje (een knop), en de pop deed precies wat er in het script stond. Als je iets anders vroeg, wist hij het niet.

Nu gebruiken we LLM's. Denk aan een LLM als een geniale acteur die alles heeft gelezen. Hij kent miljoenen boeken, gesprekken en verhalen. Omdat hij zo veel heeft gelezen, kan hij niet alleen scripttekst herhalen, maar kan hij improviseren. Hij kan een gesprek aangaan alsof hij een echte mens is, met zijn eigen mening, grappen en gevoelens.

2. De Drie Manieren om een Persoonlijkheid te "Kleden"

Hoe geef je die acteur een specifieke rol? De onderzoekers beschrijven drie manieren, alsof je een acteur een kostuum geeft:

De "Zero-Shot" Methode (De Directe Opdracht):
Je zegt tegen de acteur: "Speel vandaag een vrolijke, optimistische leraar." De acteur pakt zijn brein en doet het direct, zonder dat hij eerst geoefend heeft. Hij gebruikt zijn algemene kennis om die rol te spelen.
De "Few-Shot" Methode (Het Voorbeeldboekje):
Je geeft de acteur een klein boekje met voorbeelden. "Kijk, zo spreekt een optimistische leraar: 'Wat een prachtige dag!' en 'Je kunt dit!'." Door deze paar voorbeelden te lezen, begrijpt de acteur de stijl en doet hij het daarna zelf.
De "Fine-Tuning" Methode (De Intensieve Acteurschool):
Dit is de zwaarste training. Je neemt de acteur en laat hem wekenlang oefenen met duizenden gesprekken van een optimistische leraar. Zijn hersenen (de computer) worden dan zo aangepast dat hij altijd en automatisch die rol speelt, zelfs als hij het niet meer hoeft na te denken.

3. Het Grote Gat: Van Chat naar Virtual Reality (VR)

Tot nu toe hebben we deze slimme acteurs vooral gebruikt in chatprogramma's (zoals WhatsApp of een chatbot). Je ziet ze niet, je hoort ze niet, je voelt ze niet. Het is alsof je met iemand praat via een briefje.

Maar in Virtual Reality (VR) is het anders. Hier loop je letterlijk naast de persoon.

Het Probleem: Een chatbot kan alleen tekst sturen. Een VR-personage moet ook glimlachen, met zijn handen gebaren, in je ogen kijken en zijn stemtoon aanpassen.
De Uitdaging: Het is heel moeilijk om die tekst (wat de AI zegt) en die bewegingen (wat de AI doet) perfect op elkaar af te stemmen. Als de AI zegt "Ik ben blij", maar zijn digitale gezicht blijft strak, voelt het onnatuurlijk. Het is alsof een acteur die "Ik ben verdrietig" schreeuwt, maar dan met een glimlach op zijn gezicht. Dat werkt niet.

4. Hoe Meten We of het Lukt?

Hoe weet je of de digitale mens wel echt een persoonlijkheid heeft?

Mensen oordelen: Je vraagt mensen om met de robot te praten en te zeggen: "Voelt dit menselijk aan?" Dit is goed, maar subjectief. Iemand vindt een robot grappig, een ander vindt hem saai.
Computer-oordelen: Je laat een andere slimme computer de gesprekken analyseren. Maar computers kunnen soms vooroordelen hebben of de subtiele nuances van menselijk gedrag missen.
Woordtelling: Je telt hoeveel woorden er over emoties worden gebruikt. Maar dit is als het meten van een schilderij door alleen de verf te wegen; je mist de schoonheid van het beeld.

De onderzoekers zeggen: We hebben betere meetinstrumenten nodig. We moeten niet alleen kijken naar wat er gezegd wordt, maar ook naar hoe het gezegd wordt (de stem, het gebaar, de blik).

5. De Toekomst: Sneller en Slimmer

Er is nog één groot obstakel: Snelheid.
Deze slimme AI's zijn als olifanten in een porseleinen winkel. Ze zijn enorm en krachtig, maar ze zijn ook traag en hebben veel stroom nodig. In VR moet alles in een flits gebeuren. Als je een vraag stelt en de robot reageert pas na 5 seconden, breekt de illusie.

De oplossing? Onderzoekers kijken nu naar kleinere, slimmere versies van deze AI's (Small LLMs). Denk aan het verschil tussen een zware vrachtwagen en een snelle sportauto. De sportauto kan net zo goed rijden, maar is veel wendbaarder en sneller. Als we die kunnen maken, kunnen we binnenkort in VR praten met digitale vrienden die reageren alsof ze echt bij je in de kamer staan.

Conclusie

Kortom: Dit artikel is een reisplan voor de toekomst. Het vertelt ons dat we de technologie hebben om digitale mensen te maken die echt "menselijk" aanvoelen, maar dat we nog moeten werken aan het perfect laten samenspel van tekst, gebaren en snelheid. Als we dat voor elkaar krijgen, kunnen we in de toekomst in VR les krijgen van een geduldige leraar, therapie krijgen van een empathische arts, of gewoon een gezellig gesprek hebben met een digitale vriend die je echt begrijpt.

Integrating Personality into Digital Humans: A Review of LLM-Driven Approaches for Virtual Reality

1. De Brein-Upgrade: Van Script naar Improvisatie

2. De Drie Manieren om een Persoonlijkheid te "Kleden"

3. Het Grote Gat: Van Chat naar Virtual Reality (VR)

4. Hoe Meten We of het Lukt?

5. De Toekomst: Sneller en Slimmer

Conclusie

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten en Bevindingen

Significantie

Integrating Personality into Digital Humans: A Review of LLM-Driven Approaches for Virtual Reality

1. De Brein-Upgrade: Van Script naar Improvisatie

2. De Drie Manieren om een Persoonlijkheid te "Kleden"

3. Het Grote Gat: Van Chat naar Virtual Reality (VR)

4. Hoe Meten We of het Lukt?

5. De Toekomst: Sneller en Slimmer

Conclusie

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten en Bevindingen

Significantie

Meer zoals dit

Caption First, VQA Second: Knowledge Density, Not Task Format, Drives Multimodal Scaling

WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews

KMMMU: Evaluation of Massive Multi-discipline Multimodal Understanding in Korean Language and Context