Social Knowledge for Cross-Domain User Preference Modeling

该论文提出了一种基于大规模社交网络嵌入的跨领域用户偏好建模方法,通过将用户和实体映射到同一社交空间并利用余弦相似度进行零样本预测,不仅显著超越了基于流行度的基线模型,还揭示了社会人口因素与跨领域偏好的相关性,并展示了其与大语言模型结合以进行用户社交建模的潜力。

Nir Lotan, Adir Solomon, Ido Guy, Einat Minkov

发布于 Thu, 12 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常有趣的故事:我们如何通过一个人“关注了谁”,来猜出他喜欢什么,甚至猜出他喜欢什么领域的东西(比如从猜电影变成猜汽车)。

想象一下,你刚搬到一个新城市,想找个新朋友,但你完全不了解他。你该怎么办?

1. 核心概念:社交“气味” (Social Scent)

这篇论文的作者认为,每个人身上都有一种独特的“社交气味”

  • 传统做法的困境:以前的推荐系统(比如抖音或 Netflix)就像是一个只认识你“看电影”习惯的邻居。如果你没看过电影,或者刚注册账号(这叫“冷启动”),他就完全不知道你喜欢什么,只能瞎猜。而且,如果你告诉他你喜欢“摇滚乐”,他很难猜出你可能也喜欢“跑车”,因为在他眼里,音乐和汽车是两码事。
  • 这篇论文的新招:作者发现,我们在社交媒体(比如 Twitter/X)上关注的账号,就像是我们留下的社交指纹
    • 如果你关注了“纽约时报”和“经济学人”,你可能受过高等教育,喜欢深度思考。
    • 如果你关注了“金州勇士队”和“耐克”,你可能热爱运动。
    • 如果你关注了“泰勒·斯威夫特”和“时尚杂志”,你可能喜欢流行文化。

比喻:想象每个人都是一个调色盘。你关注的每一个账号,都是一滴颜料。虽然你还没告诉推荐系统你喜欢什么颜色的车,但把你关注的这些“颜料”混合在一起,系统就能算出你调色盘里的主色调是“运动风”还是“文艺风”。

2. 怎么做到的?(社交嵌入空间)

作者利用了一个巨大的“社交地图”(基于 Twitter 数据训练出来的数学模型)。

  • 把账号变成坐标:在这个地图里,每个明星、球队、新闻机构都有一个坐标位置。
  • 物以类聚:喜欢听摇滚的人,通常也会关注类似的乐队。所以在地图上,这些乐队的坐标会靠得很近。喜欢政治的人,关注的政客坐标也会聚在一起。
  • 把用户变成中心点:当你关注了一堆账号,系统就把这些账号的坐标“平均”一下,算出你在这个地图上的中心位置
  • 跨领域猜谜:现在,如果你想猜你喜欢什么电影,系统不需要你看过电影。它只需要看你的“中心位置”离哪些电影坐标更近。
    • 如果你的“中心”离“动作片”的坐标很近,系统就会猜你喜欢动作片。
    • 如果你的“中心”离“科幻片”的坐标很近,系统就会猜你喜欢科幻片。

简单说:系统不需要知道你喜欢“电影”,它只需要知道你喜欢“关注动作明星的人”,就能顺藤摸瓜猜出你喜欢动作电影。

3. 实验结果:只要一点点线索就够了

作者做了一个实验,把 1.2 万名用户的数据拿出来测试。

  • 惊人的效果:即使用户在某个领域(比如汽车)没有任何历史记录,系统仅凭他们在其他领域(比如音乐、新闻)的关注列表,就能非常准确地猜出他们喜欢什么车。
  • 只需 10 个线索:最酷的是,你不需要关注成千上万个账号。只要用户关注了大约 10 个他们喜欢的账号,系统就能画出足够准确的“社交画像”,从而进行跨领域的推荐。
  • 比“随大流”强得多:如果不做个性化,只是推荐“最热门”的东西(比如大家都关注的车),效果远不如这种基于“社交气味”的个性化推荐。

4. 为什么这很重要?(冷启动与 AI)

  • 解决“冷启动”难题:当你刚下载一个新 APP,系统通常不知道你喜欢什么。以前,系统只能让你先点几个赞,或者让你填问卷。
  • 新的交互方式:这篇论文提出,你可以直接告诉 AI:“我喜欢关注这些 12 个账号(比如几个歌手、几个球队)”。AI 就能立刻明白你的性格、年龄、教育背景甚至政治倾向,然后给你推荐你喜欢的电影、汽车或美食
  • LLM(大语言模型)的启示:作者还测试了用 GPT-4o(一种高级 AI)来做这件事。结果发现,只要给 AI 看这 12 个账号的名字,AI 也能像人类一样,精准地猜出你的喜好。这意味着未来的 AI 助手,不需要你填复杂的表格,只要聊几句你关注的东西,就能成为你的“懂你”专家。

5. 潜在的风险(硬币的另一面)

论文最后也诚实地提到了一个问题:偏见

  • 比喻:既然系统是通过你的关注列表来推断你的性格(比如性别、种族、政治立场),那么它可能会强化刻板印象
    • 例如,如果数据显示“关注某类汽车的人大多是男性”,系统可能会默认所有关注这类汽车的用户都是男性,从而忽略女性用户的真实需求。
    • 这就像是一个老派的邻居,看到一个人穿某种衣服,就断定他一定是某种性格的人,这可能会带来不公平。

总结

这篇论文就像是在教 AI 如何**“听其言,观其行,知其人”**。

它告诉我们,你关注谁,比你直接说了什么更能暴露你的喜好。通过把你关注的账号在“社交地图”上连成线,AI 就能跨越领域,精准地猜出你还没说出口的喜好。而且,你只需要提供很少的线索(比如 10 个关注的账号),AI 就能变得非常“懂你”。

这对于我们未来的生活意味着:以后打开新 APP,可能不再需要漫长的“新手引导”和“兴趣选择”,只要告诉 AI 你平时关注哪几个大 V,它就能立刻为你量身定制整个世界。