Optimizing Binary and Ternary Neural Network Inference on RRAM Crossbars using CIM-Explorer

本文介绍了 CIM-Explorer,这是一个模块化工具包,旨在通过提供端到端编译栈、多种映射选项及模拟器,优化基于 RRAM 交叉阵列的二值与三值神经网络推理,从而支持从早期精度评估到最终芯片编译的全流程设计空间探索。

Rebecca Pelke, José Cubero-Cascante, Nils Bosbach, Niklas Degener, Florian Idrizi, Lennart M. Reimann, Jan Moritz Joseph, Rainer Leupers

发布于 2026-03-19
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 CIM-Explorer 的新工具,它就像是一个专门为“存算一体”(Computing-in-Memory)芯片设计的超级导航仪和模拟器

为了让你轻松理解,我们可以把这项技术想象成是在建造一座极其高效的“智能图书馆”

1. 背景:为什么要建这座图书馆?(打破瓶颈)

传统的电脑(冯·诺依曼架构)就像是一个勤奋但笨拙的搬运工。它把数据从“仓库”(内存)搬到“办公桌”(CPU)去计算,算完再搬回去。如果数据量巨大,搬运工就会累死,这就是著名的“冯·诺依曼瓶颈”。

RRAM(阻变存储器) 是一种新型材料,它允许我们在“仓库”里直接进行计算,不用搬运。这就像在图书馆的书架旁直接设立了一个微型计算站,书(数据)不用搬走,直接在书架上就能被整理和分析。

但是,这个新图书馆有个大问题:
这些书架(RRAM 单元)非常敏感,容易受温度、老化影响,导致“记性”不准(比如把“是”记成“否”,或者电阻值飘忽不定)。如果强行让书架处理复杂的数字(像 8 位或 16 位数字),错误会累积,导致结果一团糟。

解决方案: 既然书架记性不好,我们就简化任务。只让它处理最简单的指令:

  • 二进制(BNN): 只有“是”(+1) 和“否”(-1)。
  • 三进制(TNN): 只有“是”(+1)、“否”(-1) 和“不知道”(0)。

2. 核心问题:之前的工具不够用

以前,研究人员手里只有半套工具

  • 有的工具只管怎么把书分类(编译器),不管书架会不会出错。
  • 有的工具只管模拟书架会出什么错(模拟器),但没法把复杂的书放进去。
  • 有的工具只关注怎么设计书架(设计空间探索),但不知道具体的书怎么放。

而且,以前的工具大多假设书架能处理复杂的数字(8 位),这在实际的粗糙硬件上根本行不通。

3. CIM-Explorer 是什么?(全能工具箱)

CIM-Explorer 就是为了解决这个问题而生的一站式工具箱。它把“分类”、“模拟”和“设计”全部打通了。

想象一下,你是一位图书管理员,CIM-Explorer 是你的智能助手,它能帮你做三件事:

A. 智能翻译官(编译器)

它能把原本复杂的神经网络(比如用来识别猫和狗的 AI 模型)“翻译”成书架能听懂的简单语言(二进制或三进制)。

  • 创意比喻: 就像把一本厚厚的《百科全书》翻译成只有“对/错”两个词的速记本,而且还能自动优化,把相关的书放在一起,减少搬运次数。

B. 多种摆放方案(映射策略)

因为书架有缺陷(不能存负数,不能存零电阻),它提供了多种摆放方案

  • 方案一(差分模式): 用两本书代表一个数字(一本代表正,一本代表负),互相抵消误差。这就像用“一正一负”两个砝码来称重,即使砝码有点不准,互相抵消后结果依然准。
  • 方案二(线性缩放): 把所有数字都变成正数,加个偏移量。这就像把所有温度都加上 100 度,变成正数再处理。
  • CIM-Explorer 的优势: 它能让你快速尝试这几种方案,看看哪种在“坏书架”上表现最好。

C. 虚拟试衣间(模拟器与设计探索)

在真的造出芯片之前,它能在电脑里模拟各种情况:

  • 如果书架的“记性”偏差大一点(细胞变异),准确率会掉多少?
  • 如果翻译官(ADC,模数转换器)的精度低一点(比如只用 3 位数字),结果还能看吗?
  • 创意比喻: 就像在虚拟世界里,你给图书馆设定了“狂风暴雨”(高噪声)或“地震”(高变异)的环境,然后看哪种“摆放方案”能让书依然整齐,分类依然准确。

4. 实验结果:它发现了什么?

研究人员用这个工具做了一些有趣的“实验”:

  1. 精度 vs. 成本: 他们发现,即使模拟器的精度很低(比如只用 3 位数字,而不是通常的 8 位),只要选对了“摆放方案”(比如 BNN VI 方案),识别准确率依然能保持很高。这意味着我们可以用更便宜、更简单的硬件。
  2. 大模型更抗造: 令人惊讶的是,更大的神经网络模型(比如 BinaryDenseNet37)在面对硬件缺陷时,反而比小模型更稳定。这就像是一个经验丰富的老图书管理员,即使书架有点乱,他也能凭经验把书找对;而新手(小模型)稍微有点乱就找不到了。
  3. 三进制(TNN)的表现: 引入“不知道”(0) 这个状态(三进制)在某些情况下比只有“是/否”(二进制)更好,因为它能更好地利用硬件特性,减少错误。

5. 总结:这对我们意味着什么?

CIM-Explorer 就像是一个桥梁,连接了“完美的理论算法”和“不完美的现实硬件”。

  • 以前: 工程师们只能盲人摸象,要么造了芯片发现算不准,要么设计了算法发现硬件不支持。
  • 现在: 有了这个工具,工程师可以在设计芯片的早期阶段,就在电脑上模拟出各种“坏情况”,选出最优的算法和硬件参数组合。

一句话总结:
这就好比你打算在漏雨的帐篷里举办一场精密的数学考试。CIM-Explorer 就是那个帮你提前模拟雨有多大、桌子怎么摆、题目怎么改,才能确保学生们(AI 模型)即使在这种恶劣环境下,依然能考出高分的超级策划师

这项研究让未来的 AI 芯片可以做得更小、更省电、更便宜,同时还能保持很高的智能水平。