LLM-Enhanced Topical Trend Detection at Snapchat

Este artigo apresenta o primeiro sistema de escala de produção, ponta a ponta, para detectar tendências temáticas no Snapchat, que integra extração multimodal, detecção de explosões em séries temporais e enriquecimento baseado em LLM para melhorar significativamente a frescura do conteúdo e a experiência do usuário por meio de implantação global.

Autores originais: Hangqi Zhao, Jay Li, Abhiruchi Bhattacharya, Cong Ni, Jason Yeung, Jinchao Ye, Kai Yang, Akshat Malu, Manish Malik

Publicado 2026-05-01
📖 4 min de leitura☕ Leitura rápida

Esta é uma explicação gerada por IA do artigo abaixo. Não foi escrita nem endossada pelos autores. Para precisão técnica, consulte o artigo original. Ler aviso legal completo

Each language version is independently generated for its own context, not a direct translation.

Imagine o Snapchat como uma cidade digital massiva e movimentada, onde milhões de pessoas postam constantemente vídeos curtos. Nessa cidade, as "tendências" são como festivais de rua súbitos e massivos ou manias de dança virais que surgem do nada. O desafio para o Snapchat é que essa cidade é grande demais e se move rápido demais para que qualquer equipe humana observe cada esquina e identifique esses festivais à medida que começam.

Este artigo descreve um novo sistema automatizado de "Vigília da Cidade", construído por engenheiros do Snapchat para detectar essas tendências no momento em que começam, usando um tipo especial de inteligência artificial chamado Modelo de Linguagem Grande (LLM).

Veja como o sistema funciona, dividido em quatro etapas simples:

1. Os "Olhos e Ouvidos" (Extração de Tópicos)

Primeiro, o sistema precisa entender o que está acontecendo nos vídeos. Como os vídeos são uma mistura de imagens, sons e texto, o sistema usa uma equipe de "detetives" de IA.

  • O Detetive Visual: Examina os quadros do vídeo para identificar quais objetos ou cenas estão presentes (como um cachorro, uma praia ou um concerto).
  • O Detetive de Áudio: Ouve o que as pessoas estão dizendo (fala para texto).
  • O Detetive de Texto: Lê qualquer palavra escrita na tela ou na legenda.
  • O Resumidor: Uma vez que essas pistas são reunidas, uma IA poderosa (o LLM) atua como um jornalista habilidoso. Ela pega todas essas informações confusas e escreve um título curto e claro para o vídeo, como "Pessoas dançando uma nova música", em vez de apenas uma lista de palavras aleatórias.

2. O "Detector de Pico" (Detecção de Explosão)

Só porque um vídeo é sobre "cachorros" não significa que é uma tendência; as pessoas postam sobre cachorros todos os dias. O sistema precisa saber quando algo fica suddenmente popular.

  • Imagine uma rua tranquila onde normalmente 5 pessoas passam por hora. De repente, 500 pessoas aparecem na próxima hora. Isso é uma "explosão".
  • O sistema rastreia quantas pessoas únicas estão postando sobre um tópico específico. Ele ignora quantas pessoas estão assistindo (para evitar viés) e foca em quantas estão criando.
  • Ele usa uma fórmula matemática para comparar os números de hoje com o passado recente. Se o número de criadores aumentar significativamente, o sistema sinaliza isso como uma tendência potencial.

3. O "Controle de Qualidade" (Pós-processamento)

Nem todo pico é uma boa tendência. Às vezes, um pico é apenas um erro, spam ou algo muito vago como "vídeos engraçados".

  • O Filtro: O sistema usa regras de IA para descartar tópicos ruins. Ele remove qualquer coisa muito ampla (por exemplo, "vida") ou qualquer coisa que viole regras de segurança (conteúdo sensível ou inseguro).
  • O Fundidor: Às vezes, o sistema detecta "Copa do Mundo 2026", "Copa do Mundo" e "Eliminatórias da Copa do Mundo" como três coisas separadas. A IA percebe que na verdade são o mesmo evento e os funde em uma única tendência limpa chamada "Copa do Mundo 2026". Isso mantém a lista organizada e fácil de entender.

4. O "Contador de Histórias" (Enriquecimento de Tendências)

Uma vez que uma tendência é confirmada, o sistema não apenas lhe dá um nome; ele cria um perfil para ela.

  • Ele seleciona alguns vídeos representativos da tendência e pede a uma IA superinteligente que escreva um resumo, atribua uma categoria (como "Esportes" ou "Notícias") e liste quais países estão falando mais sobre isso.
  • Pense nisso como transformar um ponto de dados bruto em um cartão de notícias polido que o restante do aplicativo pode usar.

Por Que Isso Importa? (Os Resultados)

O artigo relata que este sistema foi testado e agora está em operação global no Snapchat.

  • Precisão: Quando humanos verificaram o trabalho do sistema ao longo de seis meses, ele estava correto em 92,8% das vezes.
  • Impacto no Mundo Real: O sistema é agora usado para ajudar a decidir quais vídeos aparecem na sua tela (classificação) e quais sugestões aparecem quando você digita na barra de pesquisa.
  • O Resultado: Como o sistema detecta tendências mais rapidamente, os usuários veem conteúdo mais fresco e relevante. Os testes mostraram que os usuários gostaram mais do conteúdo (taxas de "curtir" mais altas) e passaram mais tempo assistindo a histórias que faziam parte dessas novas tendências.

Em resumo, este artigo descreve uma maneira inteligente e automatizada para o Snapchat ouvir o "zumbido" de toda sua base de usuários, filtrar o ruído e dizer instantaneamente ao aplicativo: "Ei, todo mundo está falando sobre isso agora — vamos mostrar para as pessoas!"

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →