Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Each language version is independently generated for its own context, not a direct translation.

这篇文章提出了一种让 AI 变得更“负责任”的新方法，核心思想可以概括为：“没有证据，就不下结论”。

为了让你轻松理解，我们可以把这篇论文想象成在讨论如何给一个**“超级自信的 AI 记者”制定新的“新闻发布纪律”**。

1. 问题：AI 的“胡说八道”太像真的了

想象一下，你问一个 AI 记者：“某位部长是不是腐败了？”
现在的 AI（生成式 AI）就像是一个口才极佳的“鹦鹉”。它读过很多书，能流利地回答你：“是的，部长肯定腐败了！”或者“不，他绝对清白！”

危险在哪里？ 即使它说错了（比如它只是根据概率猜的，或者被误导了），它说话的样子太像专家了，充满了自信。这会让普通老百姓误以为这就是**“定论”**，从而放弃自己去思考、去查证。
后果： 民主社会依赖大家能自己判断真假。如果 AI 总是抢先给出看似权威的“判决”，我们就失去了**“认知自主权”**（Epistemic Agency），也就是我们作为公民去认识世界、判断是非的能力。

2. 解决方案：布劳威尔的“三档开关”

作者提出，要解决这个问题，我们需要给 AI 装上一个**“布劳威尔式（Brouwerian）的发言开关”。这个名字听起来很学术，但我们可以把它想象成“只有拿到通行证才能说话”**的规则。

作者建议 AI 的输出不能只有“是”或“否”两个选项，而应该有三个状态：

✅ 已证实 (Asserted)： 我可以说“是”。
- 条件： 我手里拿着**“通行证”**（Certificate）。这个通行证必须是可以被公众检查、被质疑的（比如：有确凿的文件、经过审计的计算证明）。
❌ 已证伪 (Denied)： 我可以说“不”。
- 条件： 我手里拿着**“反证通行证”**（比如：有确凿证据证明他是清白的）。
❓ 未定 (Undetermined)： 我闭嘴，我不说。
- 条件： 如果我没有拿到通行证，或者证据还不够铁，我就必须说：“目前证据不足，我无法下结论。”

关键点： 这个“未定”状态不是因为 AI 太笨了，也不是因为它在“犹豫”，而是一种强制性的纪律。就像法官在证据不足时必须宣布“无罪”或“休庭”，而不是胡乱判案一样。

3. 核心比喻：AI 的“身份证”与“通行证”

为了让你更明白这个机制是如何运作的，我们可以用两个比喻：

比喻一：法庭上的“证据链”

想象 AI 是一个**“自动化的法庭书记员”**。

现在的 AI： 像是一个只会背台词的演员。它不管有没有证据，只要觉得“大概率是这样”，就大声宣布判决。
新的 AI（本文方案）： 像一个严格的法官。
- 如果它想宣布“有罪”（Asserted），它必须把**“证据包”**（Certificate）扔在桌子上。这个证据包必须包含：数据来源、计算过程、审计记录，任何人都能拿去检查。
- 如果它拿不出这个证据包，它绝对不能说“有罪”。它只能说：“证据不足，案件未定（Undetermined）”。
- 目的： 强迫 AI 把“猜测”和“事实”分开。它不再是一个“预言家”，而是一个“证据展示者”。

比喻二：修路时的“施工警示牌”

想象 AI 在一条名为“公共讨论”的高速公路上开车。

现在的 AI： 开得飞快，不管前面有没有路，它都自信地冲过去，甚至把路障当成风景。
新的 AI： 它手里拿着一个**“施工检测器”**。
- 如果检测器显示路面坚实（有通行证），它就可以继续开，并告诉路人：“路是通的”。
- 如果检测器显示路面塌陷，或者它没带检测器，它必须立刻停下，竖起**“前方未定，请绕行”**的牌子（Undetermined）。
- 为什么这么做？ 是为了防止路人（公众）因为盲目相信 AI 的“自信”而掉进坑里。

4. 这个方案如何保护我们？

这个方案的核心在于**“把责任还给人”**。

以前： AI 说“部长腐败了”，你信了，因为 AI 看起来太专业了。你放弃了思考。
现在： AI 说“目前证据不足，无法下结论（Undetermined）”，并附上理由：“因为目前的文件还没经过官方审计，或者计算结果还在模糊区间。”
- 这时候，你（作为公民）就会意识到：“哦，原来这件事还没查清楚，我需要自己去关注后续的新闻，或者去监督调查。”
- AI 没有剥夺你的判断权，反而保护了你的判断权。它强迫你面对“不确定性”，而不是让你沉溺于虚假的“确定性”中。

5. 总结：给 AI 戴上“紧箍咒”

这篇论文其实是在说：
在涉及人命、法律、选举等高风险领域，AI 不应该是一个**“全知全能的预言家”，而应该是一个“严谨的证据搬运工”**。

如果它不能拿出铁证，它就闭嘴。
如果它乱说话，就是违规。

作者借用了一位数学家（布劳威尔）的思想：数学真理不是预先存在的，而是通过一步步构建出来的。同理，AI 的“真理”也不应该是它随口说出来的，而必须是一步步构建出来的、可被检查的证据。

一句话总结：
这篇论文给 AI 定了一条新规矩：“没有铁证，不许乱说；如果证据不足，就老实承认‘我不知道’。” 只有这样，我们人类才能继续做世界的主人，而不是被 AI 的“自信”牵着鼻子走。

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种基于布劳威尔（L.E.J. Brouwer）直觉主义数学哲学的负责任人工智能（Responsible AI）设计约束，旨在解决生成式 AI 在高 stakes（高风险）领域中侵蚀人类认知能动性（Epistemic Agency）的问题。

以下是该论文的详细技术总结：

1. 研究问题 (Problem)

认知能动性的侵蚀：生成式 AI 能够将不确定性转化为看似权威的确定性判决，从而剥夺了公民在民主审议中进行识别、评估和反驳知识的责任。AI 的“流利幻觉”往往被误认为是知识，导致公众在缺乏正当理由的情况下接受结论。
现有方法的局限性：现有的不确定性量化方法（如置信度分数、语义熵、共形预测）通常仅作为统计上的拒绝选项（reject option），或者基于分布假设。它们未能从根本上区分“有正当理由的断言”与“无根据的流利表达”。
核心挑战：如何在高风险领域（如法律、医疗、政治决策）设计 AI 系统，使其在缺乏公开可审查和可争议的正当理由时，能够克制自己不做分类式的（categorical）断言，从而保护人类的认知能动性。

2. 方法论 (Methodology)

论文提出了一种名为**“布劳威尔式可断言性约束”（Brouwerian Assertibility Constraint）**的框架，将数学直觉主义转化为 AI 系统的工程规范。

2.1 核心理论基础

直觉主义真理观：真理不是预先存在的，而是通过“构造”（construction）获得的。一个命题只有在能够展示其构造（证明）时才是可断言的。
拒绝排中律 (LEM)：对于未解决的问题，不能简单地假设其为真或假。在缺乏构造性证据时，命题处于“未定”状态。
时间索引：知识是随时间演变的。随着新证据（构造）的出现，断言的资格（entitlement）也会改变。

2.2 技术架构：双重资格维度

论文设计了一个双维度的资格体系，通过**证书（Certificate）**作为边界对象连接内部计算与公共话语：

内部资格 (Internal Entitlement, $E^R_{t_{int}}$ )：
- 基于内部认证机制 $R$ （如区间传播、抽象解释、形式验证）。
- 要求系统必须能生成可检查的构造性见证（Constructive Witness），例如数值界限 $[l, u]$ 或分离边界（separation margins）。
- 只有当内部见证在声明的预算和配置下被验证有效时，系统才拥有内部断言权。
公共资格 (Public Warrant, $W^{S,\tau}_t$ )：
- 基于公共标准 $S$ 、阈值 $\tau$ 和公共记录时间 $t$ 。
- 要求断言必须基于可公开审查的证据（如官方报告、审计记录、可争议的来源）。
- 只有当内部见证与公共资格条件（如来源、范围、可争议性）同时满足时，系统才被允许进行公共断言。

2.3 接口语义：三状态机制 (A/D/U)

系统输出不再仅仅是“是/否”或概率值，而是三种状态：

Asserted (A)：存在可检查的证书，强制支持断言（即内部界限强制超过阈值，且公共资格满足）。
Denied (D)：存在可检查的证书，强制支持否定（即内部界限强制低于阈值）。
Undetermined (U)：强制状态。当缺乏强制性的见证（forcing witness）时，系统必须返回“未定”，并附带原因代码（Reason Code）。
- 原因代码包括：证据不足 (U-EVIDENCE)、范围/来源不符 (U-SCOPE)、模型界限未强制 (U-MODEL)、计算预算不足 (U-COMPUTE)。

2.4 决策层实现

阈值与 Argmax 的构造性处理：将标量分数视为“构造性实数”（通过嵌套区间序列表示）。
强制规则 (Forcing Rule)：
- 对于阈值 $\tau$ ：仅当下界 $l_n \ge \tau$ 时断言 (A)，仅当上界 $u_n < \tau$ 时否定 (D)。若区间跨越 $\tau$ ，则为 (U)。
- 对于多分类 Argmax：仅当某类的下界严格大于所有其他类的上界时，才断言该类为唯一最优解。
混合架构 (Hybrid Architecture)：建议采用“经典核心 + 构造性包装器”的模式。经典 LLM 生成流畅文本，但构造性包装器作为“言语行为门控（Speech-Act Gate）”，在输出前检查是否满足证书要求。若不满足，则强制拦截并输出带理由的 (U)。

3. 关键贡献 (Key Contributions)

布劳威尔式可断言性约束：提出了“无证书，无断言”（No certificate, no categorical speech act）的规范原则。这不仅是技术约束，更是伦理规范，要求 AI 在高风险领域必须展示其断言的正当理由。
基于证书的边界对象设计：将内部计算见证（如数值界限）与公共资格（如证据来源）封装为可审计的证书 $\kappa$ 。这解决了机器学习（工程文化）与规范审议（政治/法律文化）之间的语义鸿沟。
设计引理 (Design Lemma)：证明了任何完全的（Total）、**证书可靠的（Certificate-sound）**二元接口（仅 A/D），在逻辑上必然意味着其声明的范围内所有谓词都是可判定的（Decidable）。
- 推论：如果系统无法提供强制见证，却强行输出 A 或 D，则构成了“认识论上的不诚实”（Epistemic Misrepresentation）。因此，(U) 状态不是可调节的拒绝选项，而是当缺乏见证时的强制性状态。
时间索引的资格档案：系统的断言资格是随时间 $t$ 和公共记录变化而动态更新的，而非静态的置信度分数。
案例研究 (Tooth Social)：通过一个政治丑闻的模拟案例，展示了系统如何在证据不足时保持 (U) 状态（强制克制），并在新的官方报告出现（公共记录更新）后，通过新的证书转变为 (A) 状态。

4. 结果与发现 (Results)

强制克制：在缺乏构造性见证的情况下，系统被数学强制要求返回 (U)，防止了基于点估计（point estimates）的虚假确定性。
可解释性增强：(U) 状态不再是一个模糊的“低置信度”，而是明确指出了断言失败的具体原因（是证据不足、范围错误还是计算限制），引导用户关注具体的改进方向。
混合部署可行性：论文论证了无需完全重构为直觉主义神经网络，通过给经典模型添加“构造性包装器”（使用区间传播、共形预测等生成证书），即可在工程上实现该框架。
计算权衡：承认完全构造性方法会带来计算开销和覆盖率下降（即更多的 (U) 输出），但在高风险领域，这种“克制”是负责任部署的必要成本。

5. 意义与影响 (Significance)

哲学层面：将斯坦利·卡维尔（Stanley Cavell）的“承认（Acknowledgment）”概念和布劳威尔的直觉主义引入 AI 伦理。强调 AI 不应模拟人类的“内在声音”，而应作为人类认知能动性的脚手架，通过展示其断言的界限来促进公共审议。
民主层面：防止 AI 成为“算法中间人”滥用权力。通过强制 AI 在证据不足时保持沉默（或说明原因），保护了公民在公共领域进行判断、质疑和修正的权利，防止“后真相”时代的认知退化。
技术层面：为 AI 的可解释性和可验证性提供了新的范式。从“事后解释（Post-hoc explanation）”转向“事前见证（Pre-emptive Witness）”，将验证和证书生成作为系统输出的核心组成部分，而非附加功能。
政策层面：为高风险 AI 系统的监管提供了具体的技术路径（如强制的 (U) 状态和原因代码），有助于制定更严格的 AI 部署标准，特别是在法律、医疗和选举等关键领域。

总结：这篇论文不仅仅是一个技术提案，更是一次认识论的干预。它主张在高风险的 AI 应用中，“不知道”或“无法证明”应当被明确地表达为“未定（Undetermined）”，而不是被掩盖在流畅的文本或虚假的置信度之下。通过布劳威尔式的构造性约束，论文试图在算法的确定性与人类认知的责任之间建立一种新的平衡。