Each language version is independently generated for its own context, not a direct translation.
这篇文章提出了一种有趣的理论模型,用来解释为什么我们在网上或政治讨论中,一旦有人批评别人,对方往往会回击一句:“那你呢?你们家以前不也这么干过吗?”
这种修辞手法就是著名的"Whataboutism"(中文常译为“那又怎么说”或“反咬一口”)。作者用数学模型证明:这种“比烂”的策略不仅不能解决问题,反而会让整个社会的文明底线彻底崩塌,尤其是在大家情绪对立(极化)的时候。
为了让你轻松理解,我们可以把这个模型想象成一场两个帮派之间的“骂街游戏”。
1. 游戏设定:两个帮派与“骂人券”
想象社会被分成了两个势均力敌的帮派:红帮和蓝帮。
- 场景:每天随机发生一些事件(比如纪念日、普通日子)。有些日子大家比较敏感(比如烈士纪念日),有些日子大家比较随意。
- 行动:每个帮派里都有人手里拿着“骂人券”( offensive speech)。
- 如果骂得爽(获得内在满足感),他们就想骂。
- 但是,骂人是有风险的:如果被人抓住把柄并公开谴责,他们就要付出“社会代价”(比如被孤立、丢脸)。
- 规则:
- 内部谴责:如果红帮有人骂人,蓝帮骂他,红帮内部的人如果保持沉默,红帮内部的人也会谴责那个骂人者(“你怎么能看着自己人干这种事?”)。这种内部谴责是无法抵赖的,代价是实打实的。
- 外部谴责:如果蓝帮骂红帮,红帮的人可以反击。
2. 核心机制:“那又怎么说”(Whataboutism)的魔法
这就是模型最精彩的地方。当蓝帮指责红帮骂人时,红帮的人可以掏出一张“魔法卡”——Whataboutism。
- 魔法卡的内容:“嘿,别骂我!你们蓝帮在以前某个同样敏感(甚至更敏感)的日子里,不也骂过我们红帮的人吗?而且当时你们蓝帮内部也没人骂那个骂人者啊!你们凭什么只骂我?”
- 魔法的效果:只要红帮能成功找到这样一个“蓝帮以前干过坏事且没被内部惩罚”的例子,蓝帮的指责就失效了,红帮骂人者就不用付代价。
- 心理博弈:红帮的人心里会想:“只要我敢赌一把,赌蓝帮以前肯定干过这种事,我就能逃过一劫。”
3. 结果:为什么“比烂”会导致文明崩塌?
作者通过数学计算发现了一个可怕的恶性循环:
- 最初的平衡:在没有“魔法卡”(Whataboutism)的世界里,大家会权衡利弊。如果骂人太狠,被内部谴责的代价太大,大家就会收敛,社会保持一定的文明底线。
- 引入魔法卡:一旦允许使用“那又怎么说”,情况变了。
- 红帮的人想:“只要蓝帮以前干过坏事,我就能免责。”
- 蓝帮的人也想:“只要红帮以前干过坏事,我就能免责。”
- 互相纵容:
- 为了让自己以后能甩锅,红帮的人开始故意不谴责自己帮派里那些干坏事的人(因为如果谴责了,以后蓝帮就没法用这个例子来反击了,或者例子不够“完美”)。
- 蓝帮的人也一样。
- 结果:双方都发现,只要我不谴责自己人,我就永远有理由去骂别人。
- 底线崩溃:
- 这种逻辑导致了一个纳什均衡:大家都开始肆无忌惮地骂人,因为大家都觉得“反正对方以前也骂过,而且对方内部也没人管,所以我骂也没事”。
- 最终,社会规范彻底瓦解。无论什么日子(哪怕是敏感的纪念日),大家都开始互相攻击,因为每个人都觉得“我有理由”。
4. 极化社会的“加速器”
模型还发现,社会越极化(Polarized),情况越糟。
- 什么是极化?就是红帮的人骂人更爽(收益更高),蓝帮的人被骂更痛(愤怒值更高)。
- 后果:在极化社会里,大家更倾向于使用“魔法卡”。因为双方都更在乎自己的立场,更不愿意内部自我批评。这导致“比烂”的频率飙升,文明对话的空间被压缩到几乎为零。
5. 总结:一个生动的比喻
想象两个邻居(红队和蓝队)在比谁家的狗更爱叫。
- 正常情况:如果红队狗叫了,蓝队投诉,红队队长会说:“哎呀,真对不起,我马上管管它。”(因为怕被邻居讨厌)。
- Whataboutism 情况:红队队长说:“你管我?上周你家狗把我家花盆咬碎了,你们家也没人管啊!凭什么管我?”
- 恶性循环:
- 红队队长心想:“只要我不管我家狗,以后蓝队狗叫的时候,我就能拿这个当挡箭牌。”
- 蓝队队长心想:“只要我不管我家狗,以后红队狗叫的时候,我也能拿这个当挡箭牌。”
- 结局:两只狗都疯了,两家邻居互相指着对方鼻子骂,谁也不管谁家的狗,因为管了自家狗,就等于交出了自己的“免死金牌”。
论文的核心结论
这篇论文用数学证明了:“那又怎么说”这种修辞策略,本质上是一种“自我实现的预言”。
它让每个人都觉得“只要别人没管好,我就可以不管”。最终,这种策略不仅没有解决不公,反而摧毁了所有约束行为的道德底线,让公共讨论变得充满攻击性且毫无建设性。在分裂严重的社会里,这种效应会被无限放大,导致文明对话的彻底死亡。
Each language version is independently generated for its own context, not a direct translation.
1. 研究问题 (Problem)
核心现象:
“那又怎么说主义”(Whataboutism)是一种修辞策略,指当一方受到关于违反社会规范的指责时,通过指出对方阵营在类似或更严重的情况下也有未受谴责的违规行为来转移批评。Merriam-Webster 将其定义为“以声称对手犯有相似或更严重的过错来回应不当行为指控的做法”。
研究动机:
- 规范侵蚀: 尽管自由主义政治理论认为不同派别应就“手段”的合法性达成共识(即保持文明),但 Whataboutism 的盛行似乎侵蚀了这种共识,导致公共话语极化。
- 理论缺口: 现有的博弈论模型通常假设社会成本是线性的或外生的。然而,Whataboutism 的有效性取决于均衡状态下对方阵营的行为历史(即:对方是否真的有过类似行为且未受内部谴责)。这种策略的有效性是内生的,且依赖于心理预期。
- 核心问题: Whataboutism 如何作为一种均衡现象产生?它如何改变社会规范(特别是关于攻击性言论的规范)?在极化社会中,这种策略会导致规范完全崩溃吗?
2. 方法论 (Methodology)
作者构建了一个无限期心理博弈模型(Infinite-horizon Psychological Game),具有以下特征:
2.1 模型设定
- 参与者: 社会分为两个对称的阵营(Camp 1 和 Camp 2),每个阵营包含测度为 1 的代理人。
- 状态空间 (States): 存在一组状态 S,每个状态 s 代表一个特定的语境(Context),决定了社会对攻击性言论的敏感度。
- 敏感度参数 m:m 越大,状态越敏感。在高敏感度状态下,攻击者获得的内在效用(Intrinsic Utility)较低,受害者的痛苦(Disutility)较高。
- 博弈流程:
- 阶段 0: 公开随机抽取一个状态 s。
- 阶段 1: 来自阵营 I(s) 的代理人被选中,观察其内在收益 v(服从均匀分布 U[0,gm]),并选择是否进行攻击性言论(a=1)或保持沉默(a=0)。
- 后续阶段 (k>1): 代理人轮流被随机选中,选择支持(a=1)或谴责(a=0)之前的行为。
- 终止: 一旦有人选择 a=0(谴责),博弈结束。
2.2 支付函数与心理博弈机制
这是模型的核心创新点,基于 Geanakoplos 等人的心理博弈框架:
- 内在收益: 选择 a=1 获得 v。
- 内部谴责成本: 如果后继者来自同一阵营且选择 a=0,攻击者支付成本 1(即 v−1)。这是确定的,无法反驳。
- 外部谴责与 Whataboutism 反驳:
- 如果后继者来自敌对阵营且选择 a=0,攻击者面临外部谴责。
- 反驳机制: 攻击者可以尝试使用 Whataboutism 反驳。反驳成功的条件是:存在一个状态 s′⪰s(敏感度至少与当前状态相当),且在该状态的历史路径中,敌对阵营的代理人曾进行过攻击(a=1)且未受到其内部成员的谴责。
- 心理支付: 攻击者的期望支付取决于他成功反驳的概率。
- 若能反驳:支付为 v。
- 若不能反驳:支付为 v−1。
- 内生性: 成功反驳的概率取决于均衡策略 σ 在历史路径上的分布。这意味着攻击者的成本取决于对方阵营在均衡中表现出的行为模式。
2.3 均衡概念
- 心理子博弈完美均衡 (PSPE): 代理人在每个历史节点选择行动以最大化其基于均衡策略 σ 的心理期望支付。
- 动态稳定性 (Dynamic Stability): 由于可能存在多个 PSPE,作者引入动态稳定性标准(类似于最佳反应对应中的稳定性),选择那个对微小扰动具有鲁棒性的均衡,通常对应于攻击性言论最少的均衡。
3. 关键贡献 (Key Contributions)
- 形式化 Whataboutism: 首次将 Whataboutism 建模为一种基于均衡信念的内生策略,而非外生的修辞噪音。模型展示了该策略如何依赖于“对方阵营在类似情境下未受惩罚的历史记录”。
- 引入非线性成本: 在基准模型(无 Whataboutism)中,社会成本是线性的。而在本模型中,由于反驳成功率取决于均衡分布,攻击性言论的社会成本呈现出非线性特征。
- 规范崩溃的机制: 揭示了 Whataboutism 如何导致“规范崩溃”(Breakdown of Norms)。当敏感度低于某个阈值时,由于反驳变得极其容易(因为对方总是有违规记录且未受惩罚),内部谴责机制完全失效。
- 极化与规范的恶性循环: 证明了社会极化(Polarization)不仅增加了攻击性言论,还通过增强 Whataboutism 的有效性,进一步加剧了规范的瓦解。
4. 主要结果 (Key Results)
4.1 基准模型 (Benchmark)
在没有 Whataboutism 的情况下:
- 存在唯一的子博弈完美均衡。
- 在每个状态下,总有一部分代理人(比例 xs>0)会选择避免攻击或进行内部谴责。
- 社会规范永远不会完全崩溃。
4.2 主模型结果 (Main Model)
在引入 Whataboutism 后:
- 多重均衡与阈值: 存在多个 PSPE,由一个“敏感度阈值” m∗ 标记。
- 对于敏感度 m<m∗ 的状态:规范完全崩溃,所有代理人总是进行攻击(a=1),且从不进行内部谴责。
- 对于敏感度 m≥m∗ 的状态:存在一个正的概率代理人会避免攻击或进行内部谴责。
- 唯一稳定均衡: 动态稳定性标准选出了 m∗ 最小的均衡(即攻击性言论最少的均衡)。
- 规范崩溃的临界点: 如果参数使得 θm=λbm−2gm+2<0,则在该敏感度及更低敏感度的所有状态下,规范完全崩溃。
- λbm 代表外部谴责的概率。
- gm 代表“狂热分子”(无论成本如何都要攻击的人)的比例。
- 当外部谴责概率不足以抵消狂热分子增加带来的内部谴责减少,且 Whataboutism 使得外部谴责无效时,崩溃发生。
4.3 比较静态分析 (Comparative Statics)
- 极化效应: 如果社会变得更加极化(即 bm 和 gm 同时按比例 k 增加):
- 攻击性言论增加: 代理人进行攻击的概率上升。
- Whataboutism 使用频率增加: 反驳策略的使用变得更加普遍。
- 机制: 极化增加了“狂热分子”的比例,这使得更容易找到对方阵营违规且未受惩罚的案例(用于反驳),从而削弱了外部谴责的威慑力,形成恶性循环。
- 非线性放大: 与基准模型相比,Whataboutism 引入了“乘数效应”。参数变化(如 gm 增加)对攻击性言论频率的影响在 Whataboutism 模型中比在基准模型中更剧烈。
5. 意义与启示 (Significance)
理论意义:
- 该研究展示了心理博弈论在分析社会规范、修辞策略和公共话语方面的强大解释力。
- 它揭示了社会规范不仅仅是由外生惩罚维持的,而是由参与者对彼此行为的信念和策略性互动共同构建的。
- 证明了内生的反驳机制可能导致社会规范的非线性崩溃,解释了为何在某些极化环境下,文明对话会突然彻底失效。
现实意义:
- 社交媒体与极化: 模型解释了为何社交媒体(提供了大量可检索的“对方违规”案例)和政治极化会共同导致公共话语的恶化。
- 规范维护的脆弱性: 即使存在内部谴责机制,一旦外部批评可以通过 Whataboutism 被轻易化解,内部规范也会随之瓦解。
- 政策启示: 试图通过增加外部批评(如事实核查或公开谴责)来遏制攻击性言论,如果缺乏对“双重标准”的解决,可能会因为触发更多的 Whataboutism 而适得其反。
总结:
Eliaz 和 Spiegler 的论文通过严谨的博弈论模型证明,Whataboutism 不仅仅是一种口头上的狡辩,它是一种能够改变博弈支付结构的均衡策略。在极化社会中,这种策略通过利用对方阵营的历史违规记录来抵消外部批评,导致内部自我约束机制失效,最终引发公共话语规范的全面崩溃。这一发现为理解当代政治极化和网络暴力提供了深刻的理论依据。