Uncertainty Quantification of Click and Conversion Estimates for the Autobidding

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 DenoiseBid（去噪竞价）的新方法，旨在帮助广告平台在自动竞价时更聪明地花钱。

为了让你轻松理解，我们可以把整个广告竞价系统想象成一个在暴风雨中开船的船长，而这篇论文就是教船长如何在看不清路况时，依然能精准地驶向目的地。

1. 背景：船长与迷雾（问题是什么？）

想象一下，你是一家广告公司的“船长”（自动竞价系统）。你的任务是在茫茫大海上（互联网广告市场），每天参加成千上万次拍卖，用有限的燃料（预算）去捕捉尽可能多的鱼（用户点击和购买）。

传统的做法：船长依靠一张海图（机器学习模型）来预测哪里有鱼。海图上写着：“这里点击率（CTR）是 10%，转化率（CVR）是 5%"。
现实的问题：海图是模糊的，甚至可能是错的。因为预测模型本身就不完美，它给出的数字往往带有“噪音”（不确定性）。
- 如果海图说“这里有鱼”，但其实是雾看错了，船长就会盲目冲过去，结果扑了个空，还浪费了燃料（预算超支）。
- 如果海图说“这里没鱼”，但其实是雾挡住了视线，船长就错过了大鱼。

在广告界，这种“看错”会导致两个严重后果：

钱花错了：为了买一个其实不会点击的广告位，花了冤枉钱。
违规：广告主通常有“每次点击成本（CPC）”的限制。如果因为预测不准，导致平均点击成本超标，广告主就会生气并停止合作。

2. 核心思想：从“盲目相信”到“ Bayesian 修正”（DenoiseBid 是什么？）

以前的船长（传统算法）看到海图说"10%"，就死板地按 10% 去出价。
这篇论文提出的 DenoiseBid 方法，则像是一个经验丰富的老水手。他的逻辑是：

“海图说这里是 10%，但我知道海图有时候会看走眼（有噪音）。而且，根据我过去的经验（历史数据），这片海域的鱼群分布通常是有规律的。所以，我不能只看眼前的数字，我要结合‘海图的读数’和‘过去的经验’，算出一个最可能的真实值，再决定出多少钱。”

具体怎么做呢？（用通俗语言解释技术）

承认不确定性：不再把预测的点击率当作绝对真理，而是把它看作一个“带有误差的估计值”。
建立“经验库”（先验分布）：系统会先学习历史数据，知道在类似的情况下，真实的点击率通常长什么样（比如，大部分时候是 1%，偶尔有 10% 的爆款）。这就像船长脑子里的“经验库”。
去噪（Denoise）：当新的预测数据进来时，系统会用“经验库”去修正它。
- 如果模型预测一个广告位点击率是 50%（这太离谱了，可能是噪音），但经验库显示这种广告位通常只有 1%，系统就会把这个 50% 拉回到 1% 左右，而不是盲目相信 50%。
- 如果模型预测是 0.1%（太低了），但经验库显示这里通常有 1%，系统就会把它提高一点。
贝叶斯公式：这就是数学上的“修正”过程，它把“模型的预测”和“历史的经验”完美融合，算出一个更靠谱的后验概率。

3. 实验结果：谁更厉害？

作者做了很多实验，对比了三种船长：

** naive 船长（非鲁棒基线）**：完全相信海图，不管有没有雾。结果：雾大时，要么撞船（超支），要么错过鱼（转化少）。
保守船长（RobustBid）：因为怕出错，所以变得非常胆小，只敢在绝对确定的时候才出价。结果：虽然不超支，但鱼抓得太少了，效率低。
DenoiseBid 船长（本文方法）：既聪明又稳健。
- 它利用“经验库”去掉了海图上的“噪点”。
- 结果：在噪音很大（雾很大）的时候，它依然能抓到大鱼（转化率高），同时严格遵守预算和成本限制（不超支）。

4. 总结：这对我们意味着什么？

这就好比给自动驾驶汽车装了一个更聪明的导航系统。

以前的系统：看到路标说“前方限速 60"，就开 60。如果路标被涂鸦了（噪音），它就真的开 60，可能违规。
DenoiseBid 系统：看到路标说“限速 60"，但结合摄像头和过往数据，发现这个路标被涂鸦了，实际应该是 40。于是它自动减速到 40，既安全又合规。

一句话总结：
这篇论文提出了一种新方法，让广告自动竞价系统不再盲目相信机器模型的预测，而是学会结合历史经验去“去噪”，从而在看不清路况（数据不准）时，依然能花最少的钱，抓到最多的鱼。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《UNCERTAINTY QUANTIFICATION OF CLICK AND CONVERSION ESTIMATES FOR THE AUTOBIDDING》（自动出价中点击率和转化率估计的不确定性量化）的详细技术总结。

1. 问题背景 (Problem Statement)

在现代电子商务平台中，自动出价（Autobidding）系统通过拍卖机制为广告商分配广告位。这些系统通常基于机器学习模型预测的点击率 (CTR) 和 转化率 (CVR) 来计算最优出价。

核心痛点：现有的机器学习模型预测结果 inherently 存在不确定性（噪声）。在第二价格拍卖（SPA）机制下，最优出价是 CTR 和 CVR 的线性函数。因此，预测值的误差会直接传递到出价中，导致：
1. 预算分配次优。
2. 违反广告商的单次点击成本（CPC）约束。
3. 整体转化量下降。
现有方法的局限：
- 非鲁棒方法：直接使用预测值，对噪声敏感，容易违反约束。
- 鲁棒优化方法（如 RobustBid）：虽然能遵守约束，但通常过于保守，导致转化量大幅下降。
- 现有不确定性量化方法：要么忽略了预测模型本身的不确定性，要么将预测离散化导致信息丢失，或者限制了预测模型的类型（如仅适用于特定参数模型）。

2. 方法论 (Methodology: DenoiseBid)

作者提出了 DenoiseBid，一种基于贝叶斯框架的自动出价方法。其核心思想是将确定性的线性规划（LP）问题转化为随机优化问题，通过最大化给定观测值下的后验期望来修正出价。

2.1 核心优化目标

将传统的确定性目标替换为条件期望目标：
$\max E \left[ \sum x_t \cdot CTR_t \cdot CVR_t \mid \mathcal{O} \right]$
其中 $\mathcal{O}$ 是观测到的噪声估计值 $\{\hat{CTR}_t, \hat{CVR}_t\}$ 。

2.2 闭式出价规则推导

通过拉格朗日对偶和互补松弛条件，推导出了新的闭式出价公式：
$bid_t = \frac{1}{p^* + q^* E[CTR_t \cdot CVR_t \mid \mathcal{O}]} + \frac{q^*}{p^* + q^* C} \cdot E[CTR_t \mid \mathcal{O}]$
其中 $p^*$ 和 $q^*$ 是预算和 CPC 约束的对偶变量。关键在于计算后验期望 $E[\cdot \mid \mathcal{O}]$ 。

2.3 贝叶斯推断组件

为了计算后验期望，DenoiseBid 需要两个组件：

噪声模型 (Likelihood)：假设在 Logit 空间（Logit-CTR 和 Logit-CVR）中，观测噪声服从高斯分布。
- $\hat{\xi}_t = \xi_t + \epsilon_t, \quad \epsilon_t \sim \mathcal{N}(0, \sigma_t^2)$
先验分布 (Prior)：使用高斯混合模型 (Gaussian Mixture, GM) 来拟合真实的 CTR/CVR 分布，以捕捉现实数据中的多峰特性。

2.4 先验分布的重建 (Empirically Reconstructed Prior)

由于真实值（Ground Truth）不可知，作者利用极端反卷积 (Extreme Deconvolution, XDGMM) 技术，从带有噪声的观测数据中恢复先验分布参数。

观测到的 Logit 分布是真实先验与噪声分布的卷积。
XDGMM 能够处理每个样本不同的噪声方差，从而更准确地估计混合高斯模型的参数（权重、均值、方差）。

2.5 两种场景处理

仅 CTR 不确定性：假设 CVR 准确，CTR 与 CVR 独立。利用 Probit 近似计算后验期望。
联合 CTR-CVR 不确定性：考虑 CTR 和 CVR 之间的相关性。
- 构建二维 Logit 向量。
- 使用双变量高斯混合模型作为先验。
- 利用 Gauss-Hermite 求积法 计算乘积项 $CTR \cdot CVR$ 的期望，同时保持计算效率（适用于实时出价系统）。

3. 主要贡献 (Key Contributions)

理论框架：在噪声 CTR/CVR 条件下形式化了自动出价问题，并推导了基于贝叶斯后验期望的闭式出价规则。
DenoiseBid 算法：开发了一种模型无关（Model-free）的方法，通过 XDGMM 从噪声观测中恢复先验分布，并计算去噪后的出价。
广泛的实证验证：在四个数据集（Synthetic, iPinYou, BAT, Criteo Attribution）上进行了实验，涵盖了合成噪声和从预训练模型中提取的实证噪声。

4. 实验结果 (Results)

实验对比了三种策略：非鲁棒基线 (Non-robust)、鲁棒出价 (RobustBid) 和 DenoiseBid。

合成噪声实验：
- 随着噪声水平增加，非鲁棒基线严重违反 CPC 约束且效率下降；RobustBid 虽然遵守约束但转化量（R/R*）显著下降。
- DenoiseBid 在噪声增加时表现出最高的稳定性，在保持 CPC 约束合规的同时，实现了接近最优的转化量。
联合不确定性实验：
- 在 BAT 数据集的双变量噪声下，DenoiseBid 同样维持了稳定的转化量并严格满足约束，优于其他方法。
实证噪声实验 (Criteo Attribution)：
- 通过特征移除和数据缩放模拟不同噪声水平。
- 结果：DenoiseBid（特别是 Logit 空间高斯混合配置）在多个噪声水平下，相比非鲁棒基线，显著降低了 CPC 偏差（Cost Deviation），并在某些场景下显著提升了转化量（Conversion Uplift）。统计检验（p < 0.05）证实了这些提升的显著性。

5. 意义与结论 (Significance & Conclusion)

理论意义：首次将贝叶斯不确定性量化直接整合到基于线性规划的自动出价框架中，解决了预测误差传播导致的次优决策问题。
实践价值：
- 模型无关：不依赖于特定的预测模型架构（如 GBDT 或深度学习），只需模型能提供预测值及其不确定性（方差）。
- 计算高效：推导出的闭式解和近似方法（如 Gauss-Hermite 求积）计算速度快，满足实时出价系统的延迟要求。
- 性能提升：在严格满足广告商预算和 CPC 约束的前提下，显著提升了广告转化的 ROI，解决了鲁棒优化中“保守导致收益低”的痛点。
未来工作：计划将该框架适配到更先进的深度学习预测模型中，以应对 GBDT 逐渐被替代的趋势。

总结：DenoiseBid 通过贝叶斯去噪机制，有效地将机器学习预测的不确定性转化为更稳健的出价策略，在复杂的自动出价环境中实现了约束满足与转化收益的最佳平衡。