Each language version is independently generated for its own context, not a direct translation.
Imagine que você está em uma enorme biblioteca de vídeos (como o TikTok ou o WeChat Channels), mas o bibliotecário (o sistema de busca) às vezes não entende exatamente o que você quer.
Se você digitar apenas "Guang Liang", o bibliotecário pode ficar confuso: "Será que você quer ver um cantor famoso chamado Guang Liang ou uma garrafa de destilado com esse nome?". Se ele errar, você fica frustrado e muda sua busca.
Os autores deste artigo, da Tencent, criaram um novo sistema chamado WeWrite para resolver isso. Eles chamam o sistema de "escritor pessoal" que ajuda a reformular sua busca para que o computador entenda melhor o que você realmente deseja, baseando-se no que você já assistiu antes.
Aqui está a explicação simples de como eles fizeram isso, usando três ideias principais:
1. Quando Escrever? (Não estrague o que já funciona)
O maior problema de tentar "ajudar" o usuário é que, às vezes, a ajuda atrapalha.
- O Problema: Se você digita "Fritadeira de Ar" para cozinhar, o sistema não deve mudar sua busca para "Piadas de casais usando fritadeira" só porque você assistiu a um vídeo engraçado ontem. Isso seria um erro de foco.
- A Solução (Mineração de Amostras): O sistema aprendeu a ser um "detetive". Ele olha para o histórico e pergunta: "O usuário ficou insatisfeito com a primeira busca?".
- Se você digitou algo, não clicou em nada e mudou a busca imediatamente, o sistema entende: "Ah, ele precisa de ajuda!".
- Se você digitou algo e assistiu ao vídeo por 10 segundos, o sistema diz: "Tudo certo, não mexa nisso".
- Analogia: É como um assistente pessoal que só intervém quando você está claramente perdido, mas fica em silêncio quando você já sabe o caminho.
2. Como Escrever? (Falar a língua do computador)
Depois de saber quando ajudar, o sistema precisa saber como escrever a nova busca.
- O Problema: Inteligências Artificiais (LLMs) são ótimas em escrever textos criativos, mas às vezes criam frases tão estranhas que o banco de dados de vídeos não consegue encontrar nada (o famoso "zero resultado").
- A Solução (Treinamento Híbrido): Eles ensinaram o sistema de duas formas:
- Aula Teórica (SFT): Mostraram exemplos de buscas boas e ruins para ele aprender o básico.
- Treino de Campo (Reforço/GRPO): Aqui está a mágica. Eles criaram um sistema de recompensas. Se o sistema escreve uma busca que o computador de vídeos consegue encontrar facilmente e que os usuários gostam, ele ganha um "ponto". Se ele inventa palavras que não existem no banco de dados, ele perde pontos.
- Analogia: É como treinar um jogador de futebol. Primeiro, você ensina as regras (SFT). Depois, você coloca ele para jogar em um campo real e só deixa ele marcar gol se a bola entrar no gol (Reforço). Assim, o sistema aprende a escrever buscas que são criativas, mas que funcionam na prática.
3. Como Fazer Tudo Isso Rápido? (O Truque do "Recall Falso")
O maior inimigo da busca na internet é a lentidão. Se o sistema demorar 2 segundos para pensar na resposta, você já fechou o aplicativo.
- O Problema: Pedir para uma IA pensar e escrever uma nova frase demora muito para um sistema que precisa responder em milissegundos.
- A Solução (Arquitetura Paralela "Fake Recall"): Eles criaram um truque genial.
- Enquanto o sistema de busca tradicional já está procurando os vídeos (o caminho principal), a IA trabalha em paralelo, em uma "faixa paralela", tentando escrever a nova busca.
- Para não ter que esperar a IA terminar de buscar os vídeos do zero, eles criaram um "mapa de memórias" (um índice falso) pré-preparado. Assim que a IA escreve a nova busca, ela olha nesse mapa instantâneo e pega os resultados prontos.
- Analogia: Imagine que você está pedindo um prato no restaurante. O cozinheiro (sistema tradicional) já está preparando o prato. Enquanto isso, um garçom especial (a IA) corre para a cozinha, pega uma lista de ingredientes que você provavelmente quer, e já traz os ingredientes prontos em uma bandeja separada. Quando o prato do cozinheiro está pronto, ele mistura com os ingredientes do garçom. Você não sente que esperou mais tempo, mas o prato ficou perfeito para o seu gosto.
O Resultado?
Quando eles testaram isso em um aplicativo real com milhões de usuários:
- As pessoas assistiram a mais vídeos (e por mais tempo), porque encontraram o que queriam mais rápido.
- As pessoas pararam de mudar a busca tanto, porque o sistema entendeu o que elas queriam na primeira tentativa.
Em resumo, o WeWrite é um assistente inteligente que sabe exatamente quando intervir, como falar a língua do computador para não errar a busca e como fazer tudo isso tão rápido que você nem percebe que ele está trabalhando.
Receba artigos como este na sua caixa de entrada
Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.