BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 BiEvLight 的新方法，专门用来解决在极暗环境下如何拍出清晰照片的问题。

为了让你轻松理解，我们可以把这个问题想象成**“在嘈杂的夜店里，如何听清朋友说话”**。

1. 核心难题：为什么现在的相机在晚上拍不好？

普通相机（帧相机）的困境：
想象你在一个伸手不见五指的夜店里，想看清朋友的脸。普通相机就像是一个反应迟钝的老摄影师，为了看清，它必须把快门打开很久（长曝光）。
- 后果：如果朋友动了，照片就糊了（运动模糊）；而且因为太黑，照片里全是雪花点（噪点），根本看不清细节。
事件相机（Event Camera）的潜力与缺陷：
现在有一种新型相机叫“事件相机”，它不像普通相机那样拍完整的画面，而是像一群灵敏的哨兵，只记录“哪里发生了亮度变化”。
- 优势：它反应极快（微秒级），不会糊，而且对光线不敏感，在极暗环境下也能工作。
- 致命弱点：在极暗环境下，这些“哨兵”太敏感了，连电路里的微小电流波动（背景噪声）都会误报成“有变化”。结果就是，真正的信号（朋友的动作）被淹没在了一大堆乱喊乱叫的假警报（噪声）中。

目前的痛点：以前的方法试图把“老摄影师”（普通相机）和“哨兵”（事件相机）的数据强行拼在一起。但因为“哨兵”喊得太乱（噪声太多），拼出来的结果依然是一团糟。

2. BiEvLight 的解决方案：两个聪明的策略

作者提出了一个名为 BiEvLight 的系统，它做了两件非常聪明的事：

策略一：给“哨兵”配一个“翻译官”（梯度引导去噪）

比喻：
想象“哨兵”（事件数据）在大声乱喊，而“老摄影师”（普通图像）虽然模糊，但能大致看出轮廓（比如知道朋友站在桌子旁边）。
- 以前的方法：试图让哨兵自己安静下来，结果往往要么把真话也堵住了，要么假话还在喊。
- BiEvLight 的做法：它利用普通图像中清晰的边缘轮廓（梯度信息）作为“翻译官”。
- 原理：如果图像上显示那里有一条清晰的边缘（比如桌子的边），那么事件相机里对应的信号就是真话；如果图像上那里是一片平滑的墙壁，但事件相机里却在疯狂报警，那肯定是假话（噪声）。
- 效果：系统根据图像的轮廓，精准地告诉事件相机：“这里保留，那里删掉”。这就叫**“空间自适应梯度引导去噪”**。

策略二：让“翻译官”和“摄影师”互相学习（双层学习）

比喻：
以前的流程是：先让哨兵把噪声去掉（预处理），然后再把干净的数据交给摄影师去修图。这就像先让哨兵把话整理好，再交给翻译，翻译完就固定了，不管最后照片好不好看。
- 问题：如果哨兵为了“太干净”而把朋友的衣服花纹也删掉了，照片虽然没噪点，但细节也没了；如果为了保留细节而留了点噪声，照片又脏了。这是一个死循环。
- BiEvLight 的做法（双层优化）：
  它把这两个步骤变成了一个双向互动的团队：
  1. 下层任务（修图）：摄影师在修图时，如果发现细节不够，它会反馈给哨兵：“刚才那个地方的噪声删得太狠了，把细节也删了，请保留一点！”
  2. 上层任务（去噪）：哨兵根据摄影师的反馈，调整自己“去噪”的标准。
  3. 循环：摄影师越修越好，哨兵去噪的标准也越来越精准，两者互相配合，共同进化。
这就好比教练（修图任务）和运动员（去噪任务）一起训练。教练告诉运动员：“为了赢得比赛（拍出好照片），你需要保留多少体力（细节），去掉多少杂音（噪声）。”运动员根据教练的战术调整自己的动作，而不是死板地执行训练。

3. 最终效果：夜店里的清晰对话

通过这种**“互相配合、动态调整”**的机制，BiEvLight 取得了惊人的效果：

更清晰：在极暗环境下，它能拍出细节丰富、没有模糊的照片。
更干净：它能精准地把事件相机里的“假警报”过滤掉，只留下真正的动作信息。
数据证明：在多个公开测试集上，它的表现都超过了目前最顶尖的方法（SOTA），就像是一个原本只能看清大概的夜视仪，突然变成了高清夜视摄像机。

总结

简单来说，BiEvLight 就是给夜视系统装上了一个**“智能大脑”**：

它懂得利用普通相机的轮廓来帮事件相机辨别真假信号（去噪）。
它让去噪和修图两个过程互相商量、互相调整，而不是各干各的。

最终，它让相机在伸手不见五指的黑夜里，也能拍出像白天一样清晰、细节丰富的照片。

Each language version is independently generated for its own context, not a direct translation.

以下是基于论文《BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement》的详细技术总结：

1. 研究背景与问题 (Problem)

背景：
在低光照动态场景（如夜间自动驾驶、视频监控）中，传统帧相机由于长曝光导致运动模糊和大量噪声，难以获取高质量图像。事件相机（Event Camera）具有高动态范围（HDR）和微秒级时间分辨率，能有效克服这些问题。现有的基于事件的低光照图像增强（LLIE）方法主要致力于设计多模态融合策略。

核心挑战：

双重退化与噪声耦合： 事件相机在低光下存在严重的背景活动（BA）噪声（由内部电路随机波动和暗电流引起），而图像本身信噪比（SNR）极低。现有的融合方法往往忽略了事件数据在低光下的退化，导致在融合过程中噪声严重耦合，成为性能瓶颈。
去噪与增强的解耦困境： 现有方法通常将事件去噪视为一个静态的预处理步骤。这种策略存在两难困境：过度去噪会丢失关键的结构细节，而去噪不足则会让残留噪声进入融合阶段，损害增强质量。此外，静态去噪无法适应特定增强任务的需求，缺乏任务间的交互反馈。

2. 方法论 (Methodology)

作者提出了 BiEvLight，这是一个分层的、任务感知的双级学习框架，旨在通过利用去噪与增强任务的内在相互依赖性，协同优化两者。

2.1 核心框架：任务感知的双级优化 (Task-Aware Bilevel Learning)

BiEvLight 将事件去噪不再视为独立的预处理，而是重构为一个受增强任务约束的双级优化问题：

上层问题（Upper-level）： 事件去噪任务（参数 $w$ ）。
下层问题（Lower-level）： 低光照图像增强任务（参数 $\theta$ ）。
交互机制： 在增强过程中，下层任务通过性能增益反馈（Gain Feedback）动态校准上层的事件去噪策略；反之，经过优化的去噪事件信号为增强分支提供高信噪比的互补线索。这种机制实现了去噪与增强的协同优化，使模型能学习到专为低光增强定制的事件表示。

2.2 空间自适应梯度引导去噪 (Spatially-adaptive Gradient-guided Denoising)

针对低光下事件信号稀疏且 BA 噪声密集的问题，利用图像与事件之间强烈的梯度相关性：

原理： 事件主要由物体边缘的亮度变化触发，因此事件流在空间上与图像梯度高度相关。真实事件与梯度方向一致，而背景噪声则缺乏时空相干性。
策略： 提出一种空间自适应的梯度引导去噪策略。利用反射率分量（Reflectance）的梯度 $\nabla \tilde{x}_r$ 作为先验，指导事件流去噪。
自适应阈值： 设计了一个空间自适应阈值 $q$ ，根据局部梯度分布自动调整去噪强度。在平滑区域保留稀疏的真实事件，在纹理丰富区域抑制噪声，解决了全局掩码策略无法兼顾不同区域的问题。

2.3 网络架构

骨干网络： 采用编码器 - 解码器结构。
增强网络： 双分支架构。低光照图像先分解为初始光照图和反射率图。事件信息仅输入到反射率增强网络中，以增强图像细节（因为反射率代表物体固有属性）。
优化算法： 针对双级优化问题，采用截断的迭代微分（Truncated Iterative Differentiation, ITD）策略，通过近似隐式微分计算上层梯度，避免高阶运算的复杂性。

3. 主要贡献 (Key Contributions)

BiEvLight 框架： 提出了首个将事件去噪重构为受增强任务约束的双级优化问题的框架，打破了静态预处理的局限，实现了去噪与增强的协同优化。
空间自适应梯度引导去噪策略： 利用图像与事件的强梯度相关性，提出了一种隐式引导事件流去噪的方法，实现了在强噪声区域的精确去噪，同时保留结构细节。
广泛的实验验证： 在 SDE 和 SDSD 等真实世界噪声数据集上进行了大量实验，证明了该方法在定量指标和定性视觉效果上均优于当前最先进（SOTA）的方法。

4. 实验结果 (Results)

在 SDE 和 SDSD 数据集上，BiEvLight 与多种主流方法（如 EvLight, URWKV, FourLLIE 等）进行了对比：

定量指标（SDE 数据集）：
- 相比 SOTA 方法 EvLight，在 SDE-in 任务上 PSNR 提升了 0.68 dB，PSNR* 提升了 1.58 dB。
- 在 SDE-out 任务上 PSNR 提升了 1.92 dB，PSNR* 提升了 1.73 dB。
- 在 SDSD 数据集上也取得了最优的 PSNR 和 SSIM 表现。
定性效果：
- 在极暗场景下，BiEvLight 能重建清晰的边缘，有效去除运动模糊。
- 去噪后的事件流能清晰揭示场景中的文本信息（如路牌），而原始事件流则被噪声严重遮挡。
消融实验：
- 验证了“梯度引导去噪”策略显著提升了恢复性能。
- 验证了“双级学习”优于联合训练（Joint Learning）和交替训练（Alternating Learning），证明了任务间交互反馈的重要性。

5. 意义与价值 (Significance)

理论创新： 改变了传统“先去噪后增强”的串行处理范式，提出了“任务感知”的双级优化新范式，揭示了去噪与增强任务之间深层的耦合关系。
实际应用： 解决了事件相机在低光环境下噪声难以抑制的痛点，显著提升了夜间动态场景的成像质量，对自动驾驶、安防监控等对低光视觉要求高的领域具有重要的应用价值。
技术突破： 证明了利用图像梯度先验引导事件去噪的有效性，为多模态融合中的噪声处理提供了新的思路。

总结： BiEvLight 通过巧妙的双级学习架构和梯度引导机制，成功解决了低光下事件数据噪声耦合的难题，实现了事件去噪与图像增强的双向赋能，显著提升了低光照图像增强的性能。