SOLAR: SVD-Optimized Lifelong Attention for Recommendation

O artigo apresenta o SOLAR, um framework de modelagem de sequências para sistemas de recomendação que utiliza a atenção SVD-Optimized para reduzir a complexidade computacional de O(N2d)O(N^2 d) para O(Ndr)O(Ndr) preservando a distribuição softmax, permitindo o processamento eficiente de sequências de comportamento de grande escala e resultando em ganhos significativos de visualizações de vídeo no cenário online do Kuaishou.

Chenghao Zhang, Chao Feng, Yuanhao Pu, Xunyong Yang, Wenhui Yu, Xiang Li, Yongqi Liu, Lantao Hu, Kaiqiao Zhan, Han Li, Kun Gai

Publicado 2026-03-04
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um chef de cozinha (o sistema de recomendação) tentando decidir qual prato (vídeo) mostrar para um cliente (o usuário) em um restaurante lotado.

Até hoje, o método padrão de fazer isso era como se o chef tivesse que provar cada combinação possível de ingredientes que o cliente já comeu no passado, comparando-os um a um com cada prato novo que ele poderia oferecer.

Se o cliente comeu 10.000 pratos no passado e você tem 3.000 opções novas, o chef teria que fazer milhões de comparações. Isso é lento, cansativo e, na prática, o restaurante era obrigado a esquecer a maioria dos pratos antigos do cliente ou a provar apenas os 50 mais recentes, perdendo informações valiosas.

O papel SOLAR apresenta uma nova forma de cozinhar que resolve esse problema. Vamos explicar como:

1. O Problema: O "Caos" da Memória

O sistema atual usa uma ferramenta chamada Atenção (como uma lupa que foca no que é importante). O problema é que essa lupa é muito "gastona".

  • A analogia: Imagine que você tem que ler um livro de 10.000 páginas para decidir qual capítulo mostrar a um amigo. O método antigo exigia que você comparasse cada página com cada outra página ao mesmo tempo. Isso é impossível de fazer rápido.
  • Soluções antigas: Para ser rápido, os sistemas cortavam o livro, lendo apenas as últimas 50 páginas. O resultado? O sistema esquecia gostos antigos importantes do usuário.

2. A Solução Mágica: O "Resumo Inteligente" (SVD)

Os autores descobriram algo interessante: o histórico de um usuário não é um caos aleatório. É como uma música com muitos instrumentos, mas na verdade, a melodia principal é feita por apenas 3 ou 4 instrumentos. O resto é apenas repetição ou ruído.

Eles criaram uma técnica chamada SVD-Attention (Atenção Otimizada por SVD).

  • A analogia: Em vez de ler 10.000 páginas, o sistema usa um "resumo mágico" que captura a essência de tudo o que o usuário já viu, comprimindo 10.000 páginas em apenas 10 páginas essenciais, sem perder o significado.
  • O truque: Eles usam uma matemática chamada Decomposição em Valores Singulares (SVD) para encontrar esses "instrumentos principais" (os padrões reais de gosto) e descartar o ruído.

3. O Grande Ganho: Rápido e Completo

Com essa técnica, o sistema SOLAR consegue:

  1. Ler a vida inteira: Analisar 10.000 vídeos que o usuário viu no passado (em vez de apenas 50).
  2. Escolher entre milhares: Comparar esses 10.000 vídeos contra 3.000 opções novas, tudo em tempo real, sem travar o aplicativo.
  3. Manter a qualidade: Diferente de outros métodos rápidos que "deformam" a escolha (como se o chef provasse os pratos de forma errada), o SOLAR mantém a lógica original de escolha, apenas tornando o processo mais eficiente.

4. Por que isso importa? (O Cenário Real)

Os autores testaram isso no Kuaishou (um gigante de vídeos curtos, similar ao TikTok).

  • O resultado: O sistema começou a recomendar vídeos que as pessoas realmente queriam ver, aumentando em 0,68% o número de visualizações.
  • O impacto: Parece pouco, mas em um app com milhões de usuários, isso significa milhões de horas de entretenimento a mais e mais dinheiro para o negócio, tudo isso porque o sistema finalmente "leu" a história completa do usuário, e não apenas o começo dela.

Resumo em uma frase:

O SOLAR é como dar ao sistema de recomendação uma memória fotográfica de longo prazo que consegue processar milhões de informações instantaneamente, encontrando os padrões reais de gosto do usuário sem precisar "esquecer" o passado para ser rápido.

Em termos simples: Eles ensinaram o computador a ser rápido sem ser "esquecido", permitindo que ele recomende o vídeo perfeito baseando-se em toda a história de vida do usuário, e não apenas no que ele viu hoje de manhã.