LLM-Enhanced Topical Trend Detection at Snapchat

本文提出了首个用于在 Snapchat 上检测话题趋势的生产级端到端系统,该系统通过全球部署,集成了多模态提取、时间序列突发检测以及基于大语言模型的增强功能,从而显著提升了内容时效性和用户体验。

原作者: Hangqi Zhao, Jay Li, Abhiruchi Bhattacharya, Cong Ni, Jason Yeung, Jinchao Ye, Kai Yang, Akshat Malu, Manish Malik

发布于 2026-05-01
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一下,Snapchat 是一座庞大而繁忙的数字城市,数百万用户在此不断发布短视频。在这座城市里,“趋势”就像突然涌现的盛大街头庆典或病毒式舞蹈热潮,往往凭空出现。Snapchat 面临的挑战在于,这座城市过于庞大且运转太快,任何人类团队都无法监控每个角落并在这些庆典初现端倪时及时察觉。

本文介绍了一种由 Snapchat 工程师构建的全新自动化“城市守望”系统,该系统利用一种名为大语言模型(LLM)的特殊人工智能,在趋势萌芽的瞬间将其识别出来。

以下是该系统的运作原理,分为四个简单步骤:

1. “耳目”(主题提取)

首先,系统需要理解视频中正在发生的内容。由于视频是画面、声音和文本的混合体,系统使用了一支由 AI“侦探”组成的团队。

  • 视觉侦探:查看视频帧,识别其中的物体或场景(例如狗、海滩或音乐会)。
  • 听觉侦探:听取人们所说的话(语音转文本)。
  • 文本侦探:读取屏幕上或标题中的任何文字。
  • 总结者:一旦收集到这些线索,一个强大的 AI(即 LLM)便像一位熟练的记者。它将所有杂乱的信息整合起来,为视频撰写简短清晰的标题,例如“人们正在随着新歌起舞”,而不仅仅是一堆随机词汇的列表。

2. “激增探测器”(爆发检测)

仅仅因为一段视频是关于“狗”的,并不意味着它就是趋势;人们每天都在发布关于狗的内容。系统需要知道何时某事物突然变得流行。

  • 想象一条安静的街道,通常每小时有 5 人经过。突然,下一小时内出现了 500 人。这就是一次“激增”。
  • 系统追踪有多少独特的用户在发布关于特定主题的内容。它忽略有多少人在观看(以避免偏差),而专注于有多少人在创作
  • 它使用数学公式将今日的数据与近期过去进行对比。如果创作者的数量显著激增,系统便会将其标记为潜在趋势。

3. “质量控制”(后处理)

并非每一次激增都是好的趋势。有时激增只是故障、垃圾信息,或者是像“搞笑视频”这样过于模糊的内容。

  • 过滤器:系统利用 AI 规则剔除不良主题。它会移除过于宽泛的内容(例如“生活”)或任何违反安全规则的内容(敏感或不安全内容)。
  • 合并器:有时系统会将"2026 年世界杯”、“世界杯”和“世界杯预选赛”识别为三个独立的事物。AI 意识到这些实际上是同一事件,并将它们合并为一个单一、清晰的趋势,即"2026 年世界杯”。这保持了列表的整洁和易于理解。

4. “讲述者”(趋势丰富化)

一旦趋势得到确认,系统不仅会为其命名,还会为其建立档案。

  • 它会从该趋势中挑选几段代表性视频,并请求一个超级智能的 AI 撰写摘要、分配类别(如“体育”或“新闻”),并列出哪些国家在讨论它最多。
  • 这相当于将原始数据点转化为应用程序其余部分可使用的精美新闻卡片。

这为何重要?(结果)

该论文报告称,该系统已经过测试,目前正全球范围内在 Snapchat 上运行。

  • 准确性:当人类在六个月内检查系统的工作时,其正确率达到了92.8%
  • 现实世界影响:该系统现已被用于帮助决定哪些视频会出现在您的屏幕上(排名),以及在您输入搜索栏时会出现哪些建议。
  • 结果:由于该系统能更快地发现趋势,用户能看到更新鲜、更相关的内容。测试表明,用户更喜欢这些内容(“点赞”率更高),并且花费更多时间观看属于这些新趋势的故事。

简而言之,本文描述了一种智能、自动化的方式,让 Snapchat 能够倾听其整个用户群体的“喧嚣”,过滤掉噪音,并立即告诉应用程序:“嘿,所有人此刻都在谈论这个——让我们把它展示给大家!”

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →