Fourier-RWKV: A Multi-State Perception Network for Efficient Image Dehazing

本文提出了基于多状态感知范式的 Fourier-RWKV 网络,通过融合空间形变感知、频域感知及语义关系感知机制,在保持线性计算复杂度的同时实现了高效且高质量的图像去雾。

Lirong Zheng, Yanshan Li, Rui Yu, Kaihao Zhang

发布于 2026-02-17
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 Fourier-RWKV 的新技术,专门用来给“雾蒙蒙”的照片“洗个澡”,让它们变得清晰透亮。

想象一下,你站在大雾天里拍照,照片里全是灰蒙蒙的雾气,看不清远处的山,也看不清近处的树叶。以前的方法要么算得太慢(像老式计算器),要么看不清细节(像用钝刀切菜)。而这篇论文提出的新方法,就像是一个拥有“三头六臂”的超级修图大师,既快又准。

我们可以把这项技术拆解成三个神奇的“超能力”:

1. 第一招:会“变形”的望远镜(空间感知)

  • 以前的痛点:传统的修图工具像是一个固定的望远镜,不管雾是浓是淡,它都只用同样的方式看。如果雾在左边很浓,右边很淡,它就显得很笨拙,要么把浓雾没洗干净,要么把干净的地方洗坏了。
  • Fourier-RWKV 的绝招:它戴上了一副智能变色眼镜(DQ-Shift 技术)。这副眼镜能根据雾的浓度自动调整“焦距”和“视野”。
    • 比喻:就像你在开车,遇到浓雾路段,你会自动放慢速度、打开雾灯、调整雨刮器;遇到晴天路段,你就恢复正常。这个模型能根据图片里每一块区域的雾气情况,动态地调整它的“观察范围”,哪里雾重就重点照顾哪里,哪里清晰就保持原样。

2. 第二招:透视“灵魂”的 X 光眼(频域感知)

  • 以前的痛点:普通的修图是在“像素”层面打转,就像在沙滩上数沙子,很难看清整体的结构。而且,雾气在图片里往往表现为一种整体的“灰度”,在普通视角下很难和物体本身分开。
  • Fourier-RWKV 的绝招:它拥有一双X 光眼,能直接看到图片的“灵魂频率”(Fourier Mix 技术)。
    • 比喻:想象一张照片是一首交响乐。雾气就像是背景里一直嗡嗡作响的低音噪音,而清晰的物体是美妙的旋律。
    • 普通方法是在乐谱上一个个音符地改,效率低且容易改错。
    • 这个方法直接把乐谱变成了频谱图,它发现:雾气主要藏在“低音区”(低频),而物体的轮廓和细节藏在“高音区”(高频)和相位里。于是,它直接按住“低音区”的噪音,把“高音区”的旋律保留下来,甚至把低音区里被雾气掩盖的微弱信号也提取出来。这样,它就能在几秒钟内把整张图的“灵魂”洗干净,而且不会让远处的物体变模糊。

3. 第三招:完美的“翻译官”(语义桥接)

  • 以前的痛点:很多修图模型像是一个“ Encoder-Decoder"(编码器 - 解码器)流水线。编码器把图片压缩成“摘要”,解码器再把它还原。但在这个过程中,经常会出现“传话游戏”的误差:编码器说“这是一棵树”,解码器还原时可能变成了“一丛灌木”,导致还原出来的图有奇怪的伪影或错位。
  • Fourier-RWKV 的绝招:它在编码器和解码器之间架起了一座智能翻译桥(SBM 模块)。
    • 比喻:这就好比在两个部门之间派了一位超级联络员。当编码器把“树”的信息传过去时,联络员会立刻检查:“等等,解码器那边好像理解错了,我根据上下文动态调整一下,确保你拿到的就是最准确的‘树’的信息。”
    • 它通过一种“动态核融合”技术,确保还原出来的图片,每一根树枝、每一片叶子都严丝合缝,不会出现那种“边缘模糊”或“颜色怪异”的假象。

总结:为什么它这么厉害?

以前的方法就像是用笨重的卡车(Transformer)运货,虽然能装很多(全局视野好),但太慢太费油(计算量大),不适合实时处理。
而 Fourier-RWKV 就像是一辆高科技的电动摩托车

  1. :它的计算量是线性的(像摩托车一样轻便),处理速度极快,适合实时应用。
  2. :它结合了“变形视野”(适应局部)、"X 光透视”(全局去雾)和“智能翻译”(细节对齐)三种能力。
  3. :无论是在实验室合成的雾气,还是现实中那种忽浓忽淡、分布不均匀的复杂大雾,它都能处理得游刃有余。

一句话概括
Fourier-RWKV 就是一个既懂局部细节、又懂全局结构,还能实时动态调整策略的“去雾超人”,它让给照片去雾这件事,变得既快又好,就像给照片做了一次完美的“深层清洁 SPA"。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →