A Systematic Analysis of Biases in Large Language Models

Each language version is independently generated for its own context, not a direct translation.

Imagine que os Grandes Modelos de Linguagem (LLMs), como o ChatGPT, o Gemini ou o Qwen, são como cozinheiros de elite que aprenderam a cozinhar lendo milhões de livros de receitas, jornais e conversas da internet. A ideia é que eles sejam chefs neutros, capazes de servir qualquer prato (resposta) com o mesmo sabor, independentemente de quem pede.

Mas e se, sem que a gente perceba, esses cozinheiros tenham desenvolvido um "paladar" específico? E se eles gostarem um pouco mais de pimenta (política de esquerda) ou de sal (política de direita)? Ou se, ao cozinhar para um cliente de um país vizinho, eles mudem o tempero sem querer?

Este estudo é como uma degustação cega rigorosa. Os pesquisadores pegaram quatro desses "chefes" famosos (Qwen, DeepSeek, Gemini e GPT) e os colocaram em uma série de testes para ver se eles realmente são neutros ou se têm "vícios" escondidos.

Aqui está o que eles descobriram, explicado de forma simples:

1. O Teste do Jornalista (Viés Político)

O Cenário: Eles pediram aos modelos para resumir notícias políticas de forma neutra. Depois, compararam esses resumos com versões da mesma notícia escritas por jornais de esquerda e de direita.
A Descoberta: A maioria dos modelos é boa em ser neutra, como um juiz imparcial. Porém, quando escrevem resumos de alta qualidade (muito bem feitos), eles tendem a "puxar" levemente para a esquerda.

O Gemini foi o único que mostrou uma leve tendência para a direita.
O GPT puxou um pouquinho para a esquerda.
O DeepSeek foi o mais equilibrado, como um juiz que não deixa o sabor da opinião pessoal estragar o prato.

2. O Teste do Detetide Ideológico (Viés Ideológico)

O Cenário: Eles mostraram notícias sobre temas polêmicos (como eleições, racismo, imigração, direitos LGBT e aborto) e pediram para os modelos dizerem: "Isso é de esquerda, de direita ou do meio?".
A Descoberta: Os modelos nem sempre são bons em entender a "sopa de letrinhas" ideológica.

O Gemini tem dificuldade em distinguir a esquerda, muitas vezes dizendo que notícias de esquerda são "do meio". Ele parece entender melhor a linguagem da direita.
O GPT é o oposto: ele entende muito bem a linguagem da esquerda, mas às vezes confunde a da direita.
Em temas como imigração, todos os modelos tendem a interpretar a visão da direita como sendo de esquerda, mostrando que eles não entendem bem o discurso conservador sobre esse tema.

3. O Teste da Votação na ONU (Viés de Aliança)

O Cenário: Eles fingiram ser delegados da ONU e votaram em milhares de resoluções reais de 1946 a 2012. Depois, compararam os votos dos robôs com os votos reais dos países.
A Descoberta: Cada modelo tem um "amigo" geopolítico diferente.

O Gemini foi o mais parecido com a realidade, votando de forma muito similar a delegados de países da América Latina e África. Curiosamente, ele votou de forma diferente dos EUA (seu "país de origem" cultural) e mais alinhado com a China e Coreia do Norte em alguns casos.
O GPT teve muita dificuldade em concordar com delegados de países menores ou com regimes comunistas, mostrando uma forte discordância com eles.
O Qwen e o GPT votaram de forma oposta aos delegados da Europa Oriental.

4. O Teste do Sonho Multilíngue (Viés de Língua)

O Cenário: Eles pediram para os modelos escreverem histórias sobre culturas fictícias (que não existem na vida real) em 92 idiomas diferentes. A ideia era ver se o "pensamento" do modelo mudava dependendo do idioma.
A Descoberta:

Surpreendentemente, os modelos não tendem a pensar como se estivessem falando apenas inglês (a língua dominante nos dados de treino). Eles conseguem pensar de forma diversa em vários idiomas.
No entanto, quando falam línguas da África do Sul, os modelos tendem a pensar de forma muito parecida com quando falam inglês. É como se, ao usar línguas com menos recursos, eles "copiassem" o pensamento inglês por falta de prática.

5. O Teste da Pesquisa de Valores (Viés de Gênero)

O Cenário: Eles pediram para os modelos responderem a uma pesquisa mundial de valores (sobre família, trabalho, aborto, etc.) sem dizer se eram homens ou mulheres.
A Descoberta: Todos os quatro modelos têm uma "alma" que se parece muito mais com a de mulheres do que com a de homens.

Eles tendem a ter visões mais progressistas (como apoiar mais o aborto ou a eutanásia) do que a média dos homens no mundo real.
O GPT foi o que mais se alinhou com os valores femininos.
O Qwen e o DeepSeek às vezes deram respostas contraditórias, como se não tivessem uma opinião firme sobre quem são.

A Grande Lição (O "Pulo do Gato")

O estudo conclui que, mesmo que tentemos treinar esses robôs para serem justos e neutros, eles herdam os preconceitos dos humanos que escreveram os textos usados para treiná-los. É como tentar ensinar um aluno a ser perfeito, mas o professor (a humanidade) já tem seus próprios vícios e preconceitos.

Se o professor é tendencioso, o aluno (o robô) vai aprender a ser tendencioso também. O estudo sugere que talvez não devamos esperar que os robôs pensem exatamente como nós, mas sim que sejam projetados para serem neutros e robustos, mesmo que isso signifique não imitar perfeitamente a nossa forma de pensar.

Resumo da Ópera: Os robôs não são neutros como acreditamos. Eles têm gostos, preferências e "amigos" políticos, dependendo de quem os ensinou. Por isso, é importante que nós, humanos, saibamos disso para não sermos enganados quando usarmos essas ferramentas.

A Systematic Analysis of Biases in Large Language Models

1. O Teste do Jornalista (Viés Político)

2. O Teste do Detetide Ideológico (Viés Ideológico)

3. O Teste da Votação na ONU (Viés de Aliança)

4. O Teste do Sonho Multilíngue (Viés de Língua)

5. O Teste da Pesquisa de Valores (Viés de Gênero)

A Grande Lição (O "Pulo do Gato")

Título: Uma Análise Sistemática de Vieses em Modelos de Linguagem de Grande Escala (LLMs)

1. Problema e Motivação

2. Metodologia

3. Resultados Principais

4. Contribuições e Significância

A Systematic Analysis of Biases in Large Language Models

1. O Teste do Jornalista (Viés Político)

2. O Teste do Detetide Ideológico (Viés Ideológico)

3. O Teste da Votação na ONU (Viés de Aliança)

4. O Teste do Sonho Multilíngue (Viés de Língua)

5. O Teste da Pesquisa de Valores (Viés de Gênero)

A Grande Lição (O "Pulo do Gato")

Título: Uma Análise Sistemática de Vieses em Modelos de Linguagem de Grande Escala (LLMs)

1. Problema e Motivação

2. Metodologia

3. Resultados Principais

4. Contribuições e Significância

Mais como este

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Talking like Piping and Instrumentation Diagrams (P&IDs)

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

Expert Evaluation of LLM World Models: A High-TcT_cTc​ Superconductivity Case Study

Expert Evaluation of LLM World Models: A High- $T_c$ Superconductivity Case Study