Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

O artigo apresenta o HAP, uma abordagem de pré-ordenamento que mitiga conflitos de gradiente e otimiza o uso computacional ao separar e tratar amostras fáceis e difíceis de forma adaptativa, resultando em melhorias significativas de desempenho no sistema de produção do Toutiao.

Pengfei Tong, Siyuan Chen, Chenwei Zhang, Bo Wang, Qi Pi, Pixun Li, Zuotao Liu

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o dono de um grande shopping center (o sistema de recomendação) e recebe milhões de visitantes todos os dias. O seu objetivo é mostrar a cada pessoa as lojas e produtos que eles mais vão gostar. Mas, como você não tem tempo de mostrar tudo para todos, você precisa de um processo em etapas.

O artigo que você leu descreve uma nova inteligência artificial chamada HAP, criada pela ByteDance (dona do TikTok e do app de notícias Toutiao), para otimizar essa etapa intermediária chamada "pré-classificação".

Aqui está a explicação simplificada, usando analogias do dia a dia:

1. O Problema: A "Salada de Frutas" Confusa

Antes do HAP, o sistema tratava todos os produtos que apareciam na tela de forma igual. Imagine que você tem uma caixa misturando:

  • Pedras: Coisas óbvias que ninguém quer (ex: um anúncio de sapato para quem só gosta de livros).
  • Pedras preciosas: Coisas que o usuário vai amar.
  • Pedras quase preciosas: Coisas que são muito parecidas com o que o usuário gosta, mas não são perfeitas.

O problema é que, ao treinar o "cérebro" da IA com essa caixa misturada, as pedras preciosas difíceis (as que são quase perfeitas) gritam tão alto que o cérebro ignora as pedras comuns (que são fáceis de identificar).

  • A metáfora: É como tentar estudar para uma prova com um professor que grita apenas sobre as questões mais difíceis. Você acaba esquecendo as questões fáceis e gastando tempo demais tentando resolver o impossível, enquanto as fáceis ficam sem atenção. Isso gera um "conflito" no aprendizado.

Além disso, o sistema antigo usava um "supercomputador" gigante para analisar tudo, desde uma pedra comum até uma joia rara. Isso é um desperdício de energia e dinheiro, como usar um helicóptero para ir à padaria.

2. A Solução: O HAP (O Gerente Inteligente)

O HAP resolve isso com duas estratégias principais:

A. O Treinamento Equilibrado (A "Sala de Aula Dividida")

Em vez de misturar tudo, o HAP separa os alunos (os dados) por dificuldade:

  • Ele cria grupos de estudo separados para os "fáceis" e os "difíceis".
  • A analogia: Imagine que o professor dá uma prova separada para quem tem dificuldade em matemática e outra para quem é avançado. Assim, o professor pode focar em ajudar quem precisa sem que os avançados fiquem entediados ou atrapalhados.
  • Tecnicamente, isso se chama Aprendizado Contrastivo Harmonizado de Gradiente. Em português simples: é uma regra matemática que garante que o "grito" das pedras difíceis não abafe o aprendizado das pedras fáceis.

B. O Roteamento Inteligente (O "Filtro de Segurança")

O HAP não usa o "supercomputador" para tudo. Ele usa um sistema de dois andares:

  1. O Filtro Rápido (Modelo Leve): Um funcionário rápido e barato olha para todos os produtos. Ele diz: "Isso aqui é óbvio que não serve, jogue fora". Ele descarta 90% das coisas ruins rapidamente.
  2. O Especialista (Modelo Complexo): Só os produtos que o funcionário rápido não conseguiu decidir (os "difíceis" ou "quase perfeitos") são enviados para o especialista. O especialista usa todo o seu poder de processamento apenas nesses casos difíceis.
  • A analogia: É como um aeroporto. O funcionário de entrada (leve) verifica passaportes de turistas comuns rapidamente. Só quem tem um visto especial ou uma situação complicada é enviado para o supervisor (especialista) para uma análise detalhada. Isso economiza tempo e dinheiro.

3. O Resultado na Vida Real

Quando essa ideia foi colocada em prática no app de notícias Toutiao (um gigante chinês de notícias):

  • Mais tempo de uso: As pessoas ficaram 0,4% mais tempo no app (o que, para milhões de usuários, é um número gigantesco).
  • Mais dias ativos: As pessoas voltaram ao app em 0,05% mais dias.
  • Sem gastar mais: O sistema ficou mais inteligente, mas não gastou mais energia de computador. Na verdade, ficou mais eficiente.

Resumo Final

O HAP é como ter um gerente de equipe que sabe exatamente quem é bom em tarefas simples e quem é um gênio para tarefas complexas. Em vez de jogar todos os funcionários em todas as tarefas, ele divide o trabalho:

  1. Separa o que é fácil do que é difícil.
  2. Ensina a equipe de forma que ninguém fique confuso.
  3. Usa o "superpoder" da equipe apenas quando realmente necessário.

O resultado? Um sistema de recomendação que entende melhor o que você quer, sem custar mais caro para a empresa.