LLM-Enhanced Topical Trend Detection at Snapchat

Dit artikel presenteert het eerste productieschaal, end-to-end systeem voor het detecteren van thematische trends op Snapchat, dat multimodale extractie, tijdreeks-burstdetectie en LLM-gebaseerde verrijking integreert om de inhoudsversheid en gebruikerservaring aanzienlijk te verbeteren door wereldwijde implementatie.

Oorspronkelijke auteurs: Hangqi Zhao, Jay Li, Abhiruchi Bhattacharya, Cong Ni, Jason Yeung, Jinchao Ye, Kai Yang, Akshat Malu, Manish Malik

Gepubliceerd 2026-05-01
📖 4 min leestijd☕ Koffiepauze-leesvoer

Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je Snapchat voor als een enorme, bruisende digitale stad waar miljoenen mensen voortdurend korte video's plaatsen. In deze stad zijn "trends" als plotselinge, massale straatfeesten of virale dansrage die uit het niets opduiken. De uitdaging voor Snapchat is dat deze stad te groot is en te snel beweegt voor welk menselijk team dan ook om elke hoek te bewaken en deze festivals te ontdekken zodra ze beginnen.

Dit artikel beschrijft een nieuw, geautomatiseerd "Stadswacht"-systeem dat door Snapchat-ingenieurs is gebouwd om deze trends op het moment zelf te ontdekken, met gebruikmaking van een speciaal soort kunstmatige intelligentie genaamd een Large Language Model (LLM).

Hier is hoe het systeem werkt, opgesplitst in vier eenvoudige stappen:

1. De "Ogen en Oren" (Onderwerpextractie)

Allereerst moet het systeem begrijpen wat er in de video's gebeurt. Omdat video's een mix zijn van beelden, geluid en tekst, maakt het systeem gebruik van een team van AI-"detectives".

  • De Visuele Detective: Kijkt naar de videoframes om te zien welke objecten of scènes er zijn (zoals een hond, een strand of een concert).
  • De Audio Detective: Luistert naar wat mensen zeggen (spraak-naar-tekst).
  • De Tekstdetective: Leest alle woorden die op het scherm staan of in de bijschrift.
  • De Samenvatter: Zodra deze aanwijzingen zijn verzameld, fungeert een krachtige AI (het LLM) als een ervaren journalist. Het neemt al die rommelige informatie en schrijft een korte, duidelijke kop voor de video, zoals "Mensen die dansen op een nieuw nummer" in plaats van gewoon een lijst met willekeurige woorden.

2. De "Toename-detector" (Burst Detection)

Alleen omdat een video over "honden" gaat, betekent niet dat het een trend is; mensen plaatsen dagelijks over honden. Het systeem moet weten wanneer iets plotseling populair is.

  • Stel je een rustige straat voor waar normaal gesproken 5 mensen per uur voorbijlopen. Plotseling verschijnen er 500 mensen in het volgende uur. Dat is een "burst".
  • Het systeem houdt bij hoeveel unieke mensen over een specifiek onderwerp posten. Het negeert hoeveel mensen er naar kijken (om bias te voorkomen) en richt zich op hoeveel er creëren.
  • Het gebruikt een wiskundige formule om de cijfers van vandaag te vergelijken met het recente verleden. Als het aantal makers significant piekt, markeert het systeem dit als een potentiële trend.

3. De "Kwaliteitscontrole" (Nabewerking)

Niet elke piek is een goede trend. Soms is een piek gewoon een glitch, spam of iets te vaags zoals "grappige video's".

  • De Filter: Het systeem gebruikt AI-regels om slechte onderwerpen te verwijderen. Het verwijdert alles wat te breed is (bijvoorbeeld "leven") of alles dat veiligheidsregels schendt (gevoelige of onveilige inhoud).
  • De Samenvoeger: Soms ziet het systeem "WK 2026", "WK" en "WK-kwalificaties" als drie aparte dingen. De AI beseft dat dit eigenlijk hetzelfde evenement is en voegt ze samen tot één enkele, schone trend genaamd "WK 2026". Dit houdt de lijst netjes en begrijpelijk.

4. De "Verhaalverteller" (Trendverrijking)

Zodra een trend is bevestigd, geeft het systeem niet alleen een naam; het bouwt een profiel voor het.

  • Het kiest een paar representatieve video's uit de trend en vraagt een superslimme AI om een samenvatting te schrijven, een categorie toe te wijzen (zoals "Sport" of "Nieuws") en te vermelden welke landen er het meest over praten.
  • Denk hierbij aan het omzetten van een ruw datapunt in een gepolijste nieuwskaart die de rest van de app kan gebruiken.

Waarom is dit belangrijk? (De Resultaten)

Het artikel meldt dat dit systeem is getest en nu wereldwijd draait op Snapchat.

  • Nauwkeurigheid: Toen mensen het werk van het systeem gedurende zes maanden controleerden, was het 92,8% van de tijd correct.
  • Wereldwijd Effect: Het systeem wordt nu gebruikt om te helpen beslissen welke video's op je scherm verschijnen (ranking) en welke suggesties verschijnen als je in de zoekbalk typt.
  • Het Resultaat: Omdat het systeem trends sneller opspoort, zien gebruikers versere, relevantere inhoud. De tests toonden aan dat gebruikers de inhoud meer leuk vonden (hogere "vind-ik-leuk"-percentages) en meer tijd besteedden aan het kijken van verhalen die deel uitmaakten van deze nieuwe trends.

Kortom, dit artikel beschrijft een slimme, geautomatiseerde manier voor Snapchat om naar het "gedruis" van zijn hele gebruikersbasis te luisteren, de ruis eruit te filteren en de app direct te vertellen: "Hé, iedereen praat hier nu over—laten we het aan mensen laten zien!"

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →