이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기
Each language version is independently generated for its own context, not a direct translation.
스냅챗을 수백만 명이 끊임없이 짧은 동영상을 게시하는 거대하고 붐비는 디지털 도시라고 상상해 보세요. 이 도시에서 '트렌드'는 갑자기 나타나는 거대한 거리 축제나 바이럴 댄스 열풍과 같습니다. 스냅챗이 직면한 과제는 이 도시가 너무 크고 움직임이 너무 빨라 어떤 인간 팀도 모든 구석을 지켜보며 축제들이 시작되는 순간을 포착할 수 없다는 점입니다.
이 논문은 스냅챗 엔지니어들이 대규모 언어 모델 (LLM) 이라는 특수한 인공지능을 활용하여 트렌드가 시작되는 순간을 포착하기 위해 구축한 새로운 자동화된 '도시 감시 (City Watch)' 시스템을 설명합니다.
다음은 이 시스템이 작동하는 방식을 네 가지 간단한 단계로 나눈 것입니다:
1. '눈과 귀' (주제 추출)
먼저, 시스템은 동영상에서 무슨 일이 일어나고 있는지 이해해야 합니다. 동영상은 이미지, 소리, 텍스트가 혼합되어 있으므로 시스템은 AI '탐정' 팀을 활용합니다.
- 시각 탐정: 동영상 프레임을 살펴 개나 해변, 콘서트 같은 사물이나 장면을 식별합니다.
- 오디오 탐정: 사람들이 말하는 내용을 들어 음성에서 텍스트로 변환합니다.
- 텍스트 탐정: 화면에 쓰인 글자나 캡션의 단어를 읽습니다.
- 요약자: 이러한 단서들이 수집되면 강력한 AI(LLM) 가 숙련된 기자처럼 행동합니다. 이 AI 는 모든 복잡한 정보를 취해 동영상을 위한 짧고 명확한 헤드라인을 작성합니다. 예를 들어, 무작위 단어의 나열 대신 "새로운 노래에 맞춰 춤추는 사람들"과 같이요.
2. '급증 감지기' (버스트 감지)
동영상의 주제가 '개'라고 해서 그것이 트렌드라는 뜻은 아닙니다. 사람들은 매일 개에 대해 게시물을 올립니다. 시스템은 무언가가 갑자기 인기를 얻고 있는지 알아내야 합니다.
- 보통 한 시간에 5 명이 지나가는 조용한 거리를 상상해 보세요. 갑자기 다음 시간 동안 500 명이 나타납니다. 이것이 바로 '버스트 (급증)'입니다.
- 시스템은 특정 주제에 대해 게시물을 올리는 고유한 사람의 수를 추적합니다. (편향을 피하기 위해) 시청하는 사람의 수는 무시하고 생성하는 사람의 수에 집중합니다.
- 시스템은 수학적 공식을 사용하여 오늘의 수치를 최근 과거와 비교합니다. 생성자 수가 급격히 증가하면 시스템은 이를 잠재적인 트렌드로 플래그합니다.
3. '품질 관리' (후처리)
모든 급증이 좋은 트렌드는 아닙니다. 때때로 급증은 단순한 오류, 스팸, 또는 "재미있는 동영상"처럼 너무 모호한 것일 수 있습니다.
- 필터: 시스템은 AI 규칙을 사용하여 나쁜 주제를 제거합니다. 너무 광범위한 것 (예: "삶") 이나 안전 규칙을 위반하는 것 (민감하거나 안전하지 않은 콘텐츠) 을 삭제합니다.
- 병합: 때때로 시스템은 "2026 년 월드컵", "월드컵", "월드컵 예선"을 세 가지 별개의 것으로 감지합니다. AI 는 이들이 실제로 같은 사건임을 인식하고 "2026 년 월드컵"이라는 하나의 깔끔한 트렌드로 병합합니다. 이렇게 하면 목록이 정리되고 이해하기 쉬워집니다.
4. '이야기꾼' (트렌드 풍부화)
트렌드가 확인되면 시스템은 단순히 이름을 부여하는 것을 넘어 프로필을 구축합니다.
- 트렌드에서 몇 가지 대표적인 동영상을 선택하고 매우 똑똑한 AI 에게 요약을 작성하게 하고, 카테고리 (예: "스포츠" 또는 "뉴스") 를 할당하며, 어떤 국가에서 가장 많이 논의하고 있는지 나열합니다.
- 이는 원시 데이터 포인트를 앱 전체에서 사용할 수 있는 다듬어진 뉴스 카드처럼 만드는 것과 같습니다.
왜 이것이 중요한가? (결과)
이 논문은 이 시스템이 테스트를 거쳐 현재 전 세계적으로 스냅챗에서 운영되고 있다고 보고합니다.
- 정확도: 6 개월 동안 인간이 시스템의 작업을 확인했을 때, 정확도는 **92.8%**였습니다.
- 실제 영향: 이 시스템은 이제 화면에 표시될 동영상을 결정하는 데 (랭킹) 사용되며, 검색창에 입력할 때 표시되는 제안에도 활용됩니다.
- 결과: 시스템이 트렌드를 더 빠르게 포착하기 때문에 사용자는 더 신선하고 관련성 높은 콘텐츠를 보게 됩니다. 테스트 결과, 사용자는 콘텐츠를 더 좋아하게 되었고 (높은 '좋아요' 비율) 이러한 새로운 트렌드의 스토리를 더 오래 시청했습니다.
요약하자면, 이 논문은 스냅챐이 전체 사용자 기반의 '소란 (buzz)'을 듣고, 노이즈를 필터링하여 앱에 즉시 "이제 모든 사람이 이에 대해 이야기하고 있습니다—사람들에게 보여주세요!"라고 알리는 똑똑하고 자동화된 방법을 설명합니다.
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.