LLM-Enhanced Topical Trend Detection at Snapchat

本論文は、マルチモーダル抽出、時系列バースト検出、LLM ベースの拡張を統合し、グローバル展開を通じてコンテンツの鮮度とユーザー体験を大幅に向上させる、Snapchat におけるトピックトレンド検出のための初の生産規模のエンドツーエンドシステムを提示する。

原著者: Hangqi Zhao, Jay Li, Abhiruchi Bhattacharya, Cong Ni, Jason Yeung, Jinchao Ye, Kai Yang, Akshat Malu, Manish Malik

公開日 2026-05-01
📖 1 分で読めます☕ さくっと読める

これは以下の論文のAI生成解説です。著者が執筆または承認したものではありません。技術的な正確性については原論文を参照してください。 免責事項の全文を読む

Each language version is independently generated for its own context, not a direct translation.

スナップチャットを、数百万人が絶えず短い動画を投稿する巨大で賑やかなデジタル都市だと想像してください。この都市において、「トレンド」は、突然どこからともなく現れる大規模なストリートフェスティバルや、突如として流行するダンスブームのようなものです。スナップチャットにとっての課題は、この都市が広大すぎて、また動きが速すぎて、どの人間チームも隅々を監視し、これらのフェスティバルが始まった瞬間に発見することが不可能だということです。

本論文は、スナップチャットのエンジニアによって構築された新しい自動化された「シティウォッチ」システムについて述べています。このシステムは、大規模言語モデル(LLM)と呼ばれる特殊な人工知能を用いて、トレンドが始まった瞬間にそれを検知します。

以下に、このシステムの仕組みを 4 つの簡単なステップに分解して説明します。

1. 「目と耳」(トピック抽出)

まず、システムは動画で何が起こっているかを理解する必要があります。動画は画像、音声、テキストの混合であるため、システムは AI の「探偵」チームを使用します。

  • 視覚探偵: 動画のフレームを見て、そこにある物体や場面(犬、ビーチ、コンサートなど)を認識します。
  • 音声探偵: 人々が何を言っているかを聞き取り(音声からテキストへの変換)、内容を把握します。
  • テキスト探偵: 画面上やキャプションに書かれた言葉を読み取ります。
  • 要約者: これらの手がかりが集まると、強力な AI(LLM)が熟練したジャーナリストのように機能します。それは、そのごちゃごちゃした情報をすべて受け取り、動画のための短く明確な見出しを作成します。例えば、単なるランダムな単語の羅列ではなく、「新しい曲に合わせて踊る人々」といった形です。

2. 「急上昇検知器」(バースト検出)

動画が「犬」についてだからといって、それがトレンドであるわけではありません。人々は毎日犬について投稿するからです。システムは、何かが突然人気になったことを知る必要があります。

  • 通常、1 時間に 5 人が通り過ぎる静かな通りを想像してください。突然、次の 1 時間に 500 人が現れたとします。これが「バースト」です。
  • システムは、特定のトピックについて投稿するユニークな人の数を追跡します。(バイアスを避けるため)視聴者の数ではなく、作成者の数に焦点を当てます。
  • 数学的な数式を用いて、今日の数字を直近の過去と比較します。作成者の数が著しく急増した場合、システムはそれを潜在的なトレンドとしてフラグ付けします。

3. 「品質管理」(ポストプロセッシング)

すべての急上昇が良いトレンドというわけではありません。時には、急上昇は単なる不具合、スパム、あるいは「面白い動画」のような曖昧なものによるものです。

  • フィルター: システムは AI のルールを用いて、不適切なトピックを排除します。広範すぎるもの(例:「人生」)や、安全規定に違反するもの(機微な内容や安全でないコンテンツ)を削除します。
  • マージャー: 時として、システムは「ワールドカップ 2026」「ワールドカップ」「ワールドカップ予選」を 3 つの別々のものとして検知することがあります。AI はこれらが実際には同じイベントであることを認識し、「ワールドカップ 2026」という 1 つのクリーンなトレンドに統合します。これにより、リストは整理され、理解しやすくなります。

4. 「物語語り手」(トレンドの充実)

トレンドが確認されると、システムは単に名前をつけるだけでなく、そのプロファイルを作成します。

  • トピックからいくつかの代表的な動画を選び、超スマートな AI に要約の作成、カテゴリの割り当て(例:「スポーツ」や「ニュース」)、そしてどの国で最も話題になっているかのリスト化を依頼します。
  • これは、生データポイントを、アプリの他の部分が利用できる洗練されたニュースカードに変換することに相当します。

なぜこれが重要なのか(結果)

本論文によると、このシステムはテストされ、現在スナップチャット上で世界的に稼働しています。

  • 精度: 人間が 6 ヶ月にわたってシステムの作業を検証したところ、92.8% の確率で正しく機能していました。
  • 実社会への影響: このシステムは、画面に表示される動画の決定(ランキング付け)や、検索バーに入力した際に表示される提案の決定に役立てられています。
  • 成果: システムがトレンドを素早く検知するため、ユーザーはより新鮮で関連性の高いコンテンツを目にします。テストでは、ユーザーはコンテンツをより好むようになり(「いいね」率の上昇)、これらの新しいトレンドに属するストーリーをより長く視聴することが示されました。

要約すれば、本論文は、スナップチャットが自社のユーザーベース全体の「ざわめき」を聞き取り、ノイズをフィルタリングし、即座にアプリに「ねえ、今みんなこれが話題になっているよ—これを見せよう!」と伝えるための、賢く自動化された方法について記述しています。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →