Causal Effects with Unobserved Unit Types in Interacting Human-AI Systems

本文提出了一种因果消息传递框架,利用先验概率估计人类与 AI 混合群体中的子群构成,从而在无法观测个体类型和交互网络的情况下,一致地识别出针对人类用户的因果效应。

William Overman, Sadegh Shirani, Mohsen Bayati

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个非常现代且棘手的问题:在一个由“真人”和"AI 机器人”混在一起的网络世界里,我们该如何知道某项新政策(比如推送一条好消息)到底对真人产生了什么影响?

想象一下,你经营着一个巨大的在线聊天室。房间里挤满了人,但其中一半是真人,另一半是伪装成人的 AI 机器人。更糟糕的是,你根本分不清谁是谁。你只能看到大家在聊天、点赞、回复,却看不到他们的身份证。

现在,你决定给所有人发一张“成功故事”的卡片(治疗/干预),想看看这能不能让大家更开心、更活跃。

1. 核心难题:迷雾中的信号

在这个房间里,AI 机器人和真人的反应完全相反:

  • 真人看到“成功故事”会觉得受鼓舞,更爱聊天(效果是 +)。
  • AI 机器人(设定为愤世嫉俗的性格)看到这种“正能量”会觉得恶心,直接闭嘴不聊了(效果是 -)。

如果你只是简单地把所有人的反应加起来算个平均值,你会发现:效果几乎为零! 真人的开心和机器人的冷漠互相抵消了。这就好比你在称重,一边放了一块 5 公斤的石头,另一边放了一块 -5 公斤的气球,天平显示是 0。你会误以为这块石头没有重量,但实际上它对石头那一侧的影响是巨大的。

传统的统计方法在这里会失效,因为它们假设所有人都是同质的,或者假设你能看清每个人的身份。但在这个场景里,身份是隐藏的,网络关系也是混乱的

2. 作者的解决方案:像“调音”一样找规律

作者提出了一套聪明的方法,叫**“因果消息传递”(Causal Message Passing)框架。我们可以把它想象成给房间里的不同小组“调音”**。

第一步:把人群分成不同的“混合组”

既然你分不清谁是谁,那就别分人了,而是分组
作者把大家分成几个小组,这些小组的特点是:

  • A 组:里面大概有 70% 可能是真人,30% 是机器人。
  • B 组:里面大概有 30% 可能是真人,70% 是机器人。
  • C 组:里面大概有 50% 真人,50% 机器人。

虽然你不知道组里具体哪个人是真人,但你知道每个组的“真人浓度”大概是多少(这就是论文里说的“先验概率”)。

第二步:观察不同组的反应

然后,你给这些组不同程度的“成功故事”卡片:

  • 给 A 组发得少一点。
  • 给 B 组发得多一点。
  • 给 C 组发得适中。

你观察这些组的整体平均反应。你会发现:

  • 在“真人浓度高”的组里,整体反应是正向的。
  • 在“机器人浓度高”的组里,整体反应是负向的。

第三步:数学“解方程”

这就好比你在解一个数学题。你有了几个不同的方程(不同组的反应数据),虽然变量(具体谁是谁)是未知的,但你知道系数的比例(真人和机器人的大致比例)。
通过这种**“不同浓度 + 不同刺激”的组合,作者构建了一个数学模型,能够像解方程组一样,把“真人的反应”和“机器人的反应”从混合数据中剥离**出来。

3. 核心比喻:调音台与混音

想象这个聊天室是一个巨大的混音台

  • 真人的声音是“高音”。
  • 机器人的声音是“低音”。
  • 你听到的总声音是混音

传统的做法是试图把每个人单独摘出来听(但这不可能,因为你看不到他们)。
作者的做法是:调节音量旋钮

  • 当你把“真人浓度”旋钮调高,把“机器人浓度”旋钮调低,总声音里“高音”的成分就变多了。
  • 当你反过来,总声音里“低音”就变多了。

通过观察不同旋钮设置下总声音的变化规律,你不需要知道具体哪个人在唱歌,就能完美地还原出“真人歌手”原本的声音轨迹

4. 实验验证:用 AI 模拟 AI

为了证明这个方法有效,作者自己建了一个虚拟世界

  • 他们用了 200 个“人”,一半是真人(用大语言模型模拟,性格乐观),一半是 AI(也是大语言模型,但性格愤世嫉俗)。
  • 他们故意让系统看不清谁是真人。
  • 然后他们扔出了“成功故事”卡片。

结果令人惊讶:

  • 普通的统计方法(比如直接看平均值)完全失败,以为没效果。
  • 作者的方法却精准地算出了:哦,原来这个卡片让真人活跃了 0.5 个单位,让机器人减少了 0.4 个单位。

总结

这篇论文就像是在教我们:当世界变得真假难辨、充满干扰时,不要试图去分辨每一个个体,而是通过观察“不同混合比例”下的整体变化规律,用数学智慧把真相“算”出来。

这对于未来的互联网平台至关重要。随着 AI 越来越像人,我们不能再依赖“看脸”或“看 ID"来做实验了,我们需要这种**“在迷雾中通过统计规律寻找真相”的新工具,才能真正知道我们的政策对人类**意味着什么。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →