Modeling the dynamics of social exchange in groups with reinforcement learning and Theory of Mind

Este estudo demonstra que o compartilhamento de recursos em grupos é impulsionado não apenas pela reciprocidade, mas também por um comportamento alternado estratégico, no qual um modelo de aprendizado por reforço que incorpora a Teoria da Mente supera outras abordagens ao explicar como os indivíduos equilibram parcerias estáveis e a exploração de alternativas.

Zhang, S., Wang, H., Mendoza, R. B.

Publicado 2026-03-27
📖 4 min de leitura☕ Leitura rápida
⚕️

Esta é uma explicação gerada por IA de um preprint que não foi revisado por pares. Não é aconselhamento médico. Não tome decisões de saúde com base neste conteúdo. Ler aviso legal completo

Each language version is independently generated for its own context, not a direct translation.

O Jogo do "Presente": Como o Cérebro Decide Quem Receber

Imagine que você está em uma festa com dois amigos. Você tem apenas um biscoito para dar a um deles. Quem você escolhe? O amigo que te deu um biscoito ontem? Ou você tenta dar para o outro, para ver se ele também te dá um amanhã?

Este estudo de cientistas alemães e chineses investigou exatamente esse dilema, mas em um grupo de três pessoas, repetido por 90 vezes. Eles queriam entender: como as pessoas decidem compartilhar recursos em grupo? Será que somos apenas "espelhos" (retribuímos o que recebemos) ou temos uma "bola de cristal" mental (imaginamos o que os outros vão fazer)?

1. O Cenário: O Jogo do Biscoito

Os pesquisadores criaram um jogo chamado "Jogo do Presente".

  • Em cada rodada, uma pessoa é escolhida aleatoriamente para ser o "Doador".
  • Ela tem um token (como um ponto ou um biscoito) e deve dar para um dos outros dois.
  • Os outros dois são apenas "Receptores" e não podem fazer nada naquela rodada.
  • O jogo dura 90 rodadas.

O que eles descobriram no primeiro teste?
As pessoas não ficaram apenas dando para o mesmo amigo o tempo todo. Elas faziam algo curioso: alternavam. Se hoje você deu para o Amigo A, amanhã você tende a dar para o Amigo B.

  • Por que? Não era apenas para ser "justo" (igualdade). Era uma estratégia: "Se eu ficar só com o Amigo A, posso perder a chance de fazer uma parceria boa com o Amigo B". É como tentar diferentes parceiros de dança para ver com quem você se dá melhor.

2. A Grande Pergunta: "Eu" ou "Nós"?

Aqui entra a parte genial do estudo. Os cientistas queriam saber: quando você decide dar o biscoito, você está apenas olhando para o passado ("Ele me deu antes, então vou dar para ele") ou está usando uma Teoria da Mente (ToM)?

  • Teoria da Mente (ToM): É a capacidade de colocar-se no lugar do outro e pensar: "Se eu der este biscoito para o João, ele vai pensar que sou legal e vai me dar um de volta. Mas se eu der para a Maria, ela pode ficar ciumenta e não me dar nada."
  • É como um xadrez mental onde você simula o jogo na cabeça do seu oponente antes de fazer seu movimento.

3. Os Três Experimentos: Testando a "Bola de Cristal"

  • Experimento 1 (O Básico): As pessoas alternavam e retribuíam. Um modelo de computador que incluía essa "simulação mental" (Teoria da Mente) funcionou muito melhor do que modelos que apenas olhavam para o passado.
  • Experimento 2 (O Jogo com "Perda"): Eles adicionaram uma regra chata: depois de alguém receber o biscoito, o computador podia tirar um biscoito aleatoriamente de um dos dois.
    • A Teoria da Justiça: Se as pessoas fossem apenas "justas", elas dariam o biscoito para quem perdeu mais (para compensar).
    • A Realidade: Elas deram para quem perdeu menos. Isso prova que não era sobre justiça, mas sobre estratégia. Elas queriam manter o parceiro que estava "mais seguro" para continuar trocando presentes.
  • Experimento 3 (O Teste da Adivinhação): Aqui foi o pulo do gato. Enquanto o Doador decidia, os Receptores tinham que adivinhar para quem o Doador iria dar.
    • Se as pessoas fossem apenas máquinas de retribuição, elas seriam péssimas em adivinhar.
    • Resultado: Elas adivinharam muito bem! E o modelo que usava a "Teoria da Mente" foi o único que conseguiu prever essa habilidade de adivinhação. Isso significa que as pessoas estavam realmente simulando a mente do outro: "Eu sei que ele vai alternar, então eu vou adivinhar que ele vai mudar de alvo."

4. A Conclusão: Somos Estrategistas Mentais

O estudo nos ensina que, ao compartilhar recursos (seja dinheiro, tempo ou atenção), não somos apenas reativos. Nós somos arquitetos de relacionamentos.

  • Não é só sobre "olho por olho": A retribuição existe, mas não é tudo.
  • É sobre explorar: Nós alternamos para ver quem é o melhor parceiro a longo prazo.
  • O Cérebro é um Simulador: A chave para o sucesso social é a nossa capacidade de imaginar o que o outro está pensando e como ele vai reagir ao nosso gesto.

Em resumo:
Imagine que a vida social é um jogo de cartas. O estudo mostra que os melhores jogadores não são aqueles que apenas olham para as cartas que já saíram (o passado), mas sim aqueles que conseguem imaginar quais cartas o outro jogador vai tirar e como ele vai reagir à sua jogada. Essa "simulação mental" é o que nos permite criar laços fortes e duradouros em grupos.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →