Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

Este estudo apresenta um agente de IA para o jogo Werewolf, desenvolvido para a tarefa compartilhada AIWolfDial 2024, que utiliza resumos de diálogo e informações de persona para aprimorar a consistência contextual e a manutenção da personalidade das respostas geradas por modelos de linguagem.

Yoshiki Tanaka, Takumasa Kaneko, Hiroki Onozeki, Natsumi Ezure, Ryuichi Uehara, Zhiyang Qi, Tomoya Higuchi, Ryutaro Asahara, Michimasa Inaba

Publicado Tue, 10 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está jogando um jogo de "Mafia" ou "Lobisomem" com amigos, mas em vez de pessoas, você está conversando com Inteligências Artificiais (IAs). O objetivo é descobrir quem é o vilão (o lobisomem) e quem é o inocente, usando apenas a conversa.

Este paper (artigo científico) conta a história de como uma equipe de pesquisadores criou IAs muito boas para jogar esse jogo, focando em dois grandes problemas: memória e personalidade.

Aqui está a explicação simples, usando analogias do dia a dia:

1. O Problema: "A Memória de Elefante" vs. "O Cérebro Humano"

No jogo de Lobisomem, a conversa dura vários dias. Os jogadores falam muito, repetem coisas e às vezes dizem bobagens.

  • O Desafio: Se você pedir para uma IA ler todas as conversas de todos os dias desde o início do jogo, ela fica sobrecarregada. É como tentar ler um livro inteiro de 1.000 páginas só para responder a uma pergunta simples sobre o capítulo 1. Além disso, custa caro e demora muito.
  • A Solução (Resumo de Diálogo): Os pesquisadores ensinaram a IA a ser um secretário eficiente. Ao final de cada dia de jogo, a IA cria um "resumo executivo" do que aconteceu.
    • Analogia: Em vez de ler todo o jornal do mês passado, a IA lê apenas o "Resumo das Manchetes" do dia anterior. Assim, ela lembra que "o Agente 05 mentiu" ou "o Agente 01 disse que é o vidente", sem precisar ler cada palavra que foi dita. Isso mantém a IA focada e consistente.

2. O Problema: "O Camaleão" vs. "O Personagem Fixo"

IAs modernas são ótimas em conversar, mas elas tendem a mudar de personalidade dependendo de quem está falando com elas. Se um jogador fala de forma agressiva, a IA pode ficar agressiva também. No jogo, isso é ruim, porque você precisa de um personagem que mantenha sua "alma" do início ao fim.

  • O Desafio: Como fazer a IA parecer que é a mesma pessoa (com o mesmo tom de voz e personalidade) do primeiro ao último turno?
  • A Solução (Personas Criadas à Mão): Os pesquisadores deram um "manual de instruções" e um "álbum de fotos" para cada IA.
    • Analogia: Imagine que você está fazendo um teste de elenco para uma peça de teatro. Antes de entrar no palco, cada ator recebe um currículo de personagem (ex: "Você é um rei orgulhoso" ou "Você é um adolescente de 17 anos, fã de futebol e fala rápido").
    • Eles também deram exemplos de frases que esses personagens diriam. Assim, mesmo que o jogo fique caótico, a IA sabe: "Ei, eu sou o Rei, não posso falar gírias de adolescente!". Isso garante que o "Rei" continue soando como um rei até o fim do jogo.

3. Como Eles Jogam (O "Cérebro" da Decisão)

Para decidir quem votar ou quem atacar, a IA não chuta. Ela usa uma técnica chamada "Cadeia de Pensamento" (Chain-of-Thought).

  • Analogia: É como se a IA fosse um detetive que precisa escrever seu diário de investigação antes de fazer a acusação. Ela pensa: "O Agente X mentiu sobre isso, o Agente Y está muito quieto, então vou investigar o Agente X primeiro". Isso evita que a IA mude de ideia sem motivo.

O Resultado?

Os pesquisadores testaram suas IAs jogando entre elas (um "self-match"). O resultado foi impressionante:

  • As IAs lembravam do que aconteceu no dia anterior (graças aos resumos).
  • Elas mantinham suas personalidades (o Rei falava como Rei, o adolescente falava como adolescente) do começo ao fim.
  • Elas não se contradiziam (não diziam "o Agente X é inocente" de manhã e "o Agente X é o lobisomem" à tarde, sem motivo).

Em resumo: A equipe criou IAs que são bons secretários (resumem o passado), bons atores (mantêm a personagem) e bons detetives (pensam antes de agir), tornando o jogo de Lobisomem muito mais realista e consistente.