Each language version is independently generated for its own context, not a direct translation.
Imagine que você tem um chef de cozinha extremamente talentoso (o Modelo de Linguagem, ou LLM). Esse chef sabe cozinhar qualquer prato do mundo: desde matemática complexa até receitas de bolo. Ele conhece os fatos, as regras e os ingredientes perfeitamente.
O problema é que, quando você pede a esse chef para cozinhar um prato específico para um cliente muito exigente (por exemplo, um cliente que ama comida saudável e sustentável, mas odeia desperdício), o chef tenta mudar a receita inteira.
Aqui está o que acontece de ruim com os métodos atuais:
- O Chef Esquece o Sabor Original: Ao tentar agradar o cliente, ele começa a esquecer os ingredientes reais. O bolo fica com gosto de "sustentabilidade", mas vira uma massa sem graça. Isso é chamado de Alucinação (inventar fatos) ou Esquecimento de Conhecimento.
- O Chef Muda de Personalidade: O chef, que era neutro e profissional, começa a agir como se ele fosse o cliente. Ele perde a sua própria identidade e a precisão técnica. Isso é chamado de Desvio de Valores.
O artigo "VISA" propõe uma solução inteligente para esse problema. Vamos usar uma analogia de tradução e direção para explicar como funciona.
A Solução VISA: O "Tradutor de Valores" Blindado
Em vez de treinar o chef de novo do zero (o que faz ele esquecer tudo), o VISA cria um sistema de três pessoas trabalhando juntas:
1. O Chefe de Cozinha Congelado (A Base de Conhecimento)
Imagine que o chef original é "congelado". Ele não muda. Ele continua sendo o especialista em fatos, matemática e receitas. Ele é a fonte da verdade. Nada nele é alterado.
2. O Tradutor de Pedidos (O Detector e Tradutor)
Quando o cliente diz: "Quero que essa resposta seja mais conservadora e segura", o Tradutor não muda o prato. Ele apenas traduz essa frase em um mapa de coordenadas (um vetor de valores).
- Analogia: É como se o cliente dissesse "Quero o prato com mais sal e menos pimenta". O Tradutor mede exatamente quanto sal e quanto pimenta o prato original tem e calcula a diferença necessária.
3. O Revisor de Estilo (O Rewriter)
Aqui está a mágica. Existe um Revisor (um assistente leve e inteligente) que pega a receita original do Chefe Congelado e o "mapa de coordenadas" do Tradutor.
- O Revisor reescreve o texto.
- Ele muda o tom, a fraseologia e a ênfase para atender ao pedido do cliente (ex: tornar o texto mais conservador).
- Mas, ele tem uma regra de ouro: Nunca inventar um ingrediente novo e nunca tirar um ingrediente essencial. Ele mantém a "substância" do prato intacta, mudando apenas o "tempero".
Como eles aprendem a fazer isso? (O Treinamento)
O Revisor não aprende apenas lendo. Ele aprende jogando um jogo de tente e erre, mas de forma muito inteligente (usando uma técnica chamada GRPO).
Imagine que o Revisor gera 8 versões diferentes do mesmo texto. Um "juiz" (um sistema automático) avalia cada uma:
- Nota de Valor: O texto ficou com o "sabor" certo que o cliente pediu? (Ex: Ficou mais conservador?)
- Nota de Fidelidade: O texto ainda tem os mesmos fatos do original? (Ex: Ele não inventou que o bolo é de chocolate se a receita original era de baunilha?)
O Revisor recebe uma recompensa apenas se conseguir ambas as notas altas. Ele aprende a equilibrar a balança: mudar o estilo sem estragar a verdade.
Por que isso é importante?
Atualmente, se você pedir para uma IA mudar de opinião ou adaptar-se a uma cultura específica, ela tende a:
- Mentir (alucinar fatos novos).
- Esquecer o que ela sabia antes.
O VISA resolve isso separando o "O QUE" (os fatos, que ficam congelados no Chefe) do "COMO" (o estilo e os valores, que são ajustados pelo Revisor).
Resumo em uma frase:
O VISA é como ter um GPS inteligente que ajusta a rota do carro (a resposta da IA) para chegar ao destino desejado (os valores do usuário) sem nunca tirar o carro da estrada segura (os fatos e o conhecimento original), evitando que o motorista (o modelo) se perca ou invente caminhos falsos.
Isso permite criar IAs personalizadas para empresas, culturas ou indivíduos, que são úteis e seguras, sem perder a capacidade de dizer a verdade.
Receba artigos como este na sua caixa de entrada
Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.