Quantifying Harm

本文通过构建一个用于在不确定性下衡量个体与社会危害的量化框架,扩展了先前对危害的定性定义,证明了简单的聚合方法可能产生反直觉的结果,并提出了决策理论替代方案,特别是在精准医疗的背景下。

原作者: Sander Beckers, Hana Chockler, Joseph Y. Halpern

发布于 2026-05-07
📖 1 分钟阅读☕ 轻松阅读

原作者: Sander Beckers, Hana Chockler, Joseph Y. Halpern

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

以下是论文《量化伤害》的通俗解释,辅以日常类比。

宏观视角:从“是否造成伤害?”到“造成了多大伤害?”

想象你是一位法官,正在裁定一个新的 AI 系统是否造成了伤害。过去,作者们(Beckers、Chockler 和 Halpern)遵循一条简单的规则:是或否。AI 是否造成了伤害?如果答案是“是”,那就到此为止。

但在现实世界中,我们需要更精确。我们不仅想知道伤害是否发生,还想知道它有多严重,以便我们做出最佳选择。这篇论文旨在构建一把数学标尺来衡量伤害的“量”,而不仅仅是一个表示“开”或“关”的开关。

1. 基线:什么是“正常”?

要衡量伤害,你需要一个起点。这就像恒温器。

  • 默认效用:这是房间的“正常”温度。
  • 结果:这是加热器或空调运行后的实际温度。

如果房间本应是 70°F(默认值),而加热器将其升至 75°F,这是一种收益。如果空调将其降至 60°F,这就是一种伤害。伤害的量 simply 是你应该处于的位置与你实际到达的位置之间的差值。

转折:论文认为,“正常”并不总是零。有时,“正常”是一个范围。

  • 类比:想象给服务员小费。
    • 范围:15% 到 20% 的小费是“正常”的。它既不好也不坏;这只是预期。
    • 伤害:如果你给 5% 的小费,你就造成了伤害(你低于底线)。
    • 收益:如果你给 50% 的小费,你就创造了收益(你高于上限)。
    • 要点:你不能简单地说“钱越多越好”。存在一个“甜蜜点”,在那里什么也不会发生。

2. 掷骰子:应对不确定性

生活很少是确定的。有时医生的手术治愈了病人;有时却导致其死亡。当结果是一场赌博时,我们如何衡量伤害?

论文考察了人们实际上是如何思考风险的,而这往往很奇怪。

  • “无人驾驶汽车”问题:想象一辆自动驾驶汽车。
    • 选项 A:按限速行驶。发生致命车祸的几率是百万分之一。
    • 选项 B:慢速行驶 20%。发生致命车祸的几率是两百万分之一。
    • 数学计算:选项 B 更安全。如果你只做数学计算(期望效用),你应该总是选择 B。
    • 现实:人们往往更喜欢选项 A。为什么?因为我们的头脑将百万分之一的几率视为“基本为零”。我们忽略了微小的风险。

作者建议我们使用概率加权。不要线性地对待 1% 的风险和 0.0001% 的风险,而是给它们施加一个“权重”。

  • 类比:想象一个放大镜。
    • 有时我们使用放大镜,让微小的风险看起来巨大(例如,在听到恐怖袭击报道后对其感到恐惧)。
    • 有时我们使用“调光开关”,让微小的风险消失(例如,因为每天都开车而忽略车祸风险)。
    • 为了准确衡量伤害,我们必须考虑人类实际如何感知这些几率,而不仅仅是原始数字。

3. 群体问题:公平性与聚合

当一项政策伤害了 1,000 人时会发生什么?我们只是把痛苦相加吗?

  • “总和”陷阱:如果政策 A 让 1,000 个随机的人受到一点点伤害,而政策 B 让 1 个特定的人受到很大伤害,简单的数学求和可能会说它们是相等的。
  • 公平性问题:直觉上,我们对这两种情况的感觉不同。伤害 1,000 个随机的人与针对 1 个特定的人(或特定群体,如少数族裔社区)感觉是不同的。

论文提出了公平性惩罚

  • 类比:想象学校食堂。
    • 如果食堂不小心给 100 个随机学生提供了糟糕的午餐,那很烦人。
    • 如果食堂给坐在 5 号桌的学生提供糟糕的午餐,那感觉就像霸凌。
    • 作者建议,我们的“伤害计算器”应该在某项政策不成比例地伤害特定、可识别的群体时,加上巨大的惩罚。这不仅仅关乎受伤人数的总数,还关乎受了伤。

4. 精准医疗辩论

这篇论文将这些观点与医学界近期关于“精准医疗”(针对特定基因定制治疗方案)的争论联系起来。

  • 冲突:一些专家说,“如果平均收益为正,就治疗病人。”另一些人说,“不,我们必须优先考虑避免对个人的伤害,即使平均收益为正。”
  • 作者的观点:他们表明,这场辩论实际上只是他们已经解决的问题的一个特定版本。
    • “平均收益”方法忽略了“默认值”(如果我们什么都不做会发生什么)。
    • “避免伤害”方法通常依赖于对因果关系的具体定义(“若非”测试:“若非接受治疗,他们本会死亡吗?”)。
    • 作者认为,医学界的辩论忽略了背景的细微差别。什么是“伤害”取决于治疗前病人的生活状况。如果病人已经濒临死亡,即使有风险的治疗导致其死亡,也可能不被视为“有害”,因为替代方案本来就是死亡。

5. 困难部分:数学很棘手

最后,论文承认计算这一点在计算上非常困难。

  • 类比:想象试图解决一个巨大的数独谜题,每次你移动一个数字,谜题的规则都会发生轻微变化。
  • 作者证明,在 worst-case scenario(最坏情况)下,精确计算出“多少”伤害发生是一个超级计算机需要很长时间才能解决的问题。
  • 然而:他们争辩说,在现实生活中,谜题通常没有那么大。大多数决策涉及可管理的变量数量,因此我们仍然可以在实践中使用这些定义。

总结

这篇论文构建了一个复杂的工具来衡量伤害。它超越了简单的“是/否”答案,转而询问:

  1. 与“正常”基线相比,结果有多糟糕?
  2. 我们如何调整以反映人类感知风险的方式(忽略微小风险与恐惧它们)?
  3. 我们如何确保没有不公平地针对特定群体?

通过回答这些问题,作者希望帮助 AI 系统、医生和政策制定者做出更符合人类直觉的决策,即什么才是真正“有害”的。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →