Lyra: A Hardware-Accelerated RISC-V Verification Framework with Generative Model-Based Processor Fuzzing

本文提出了 Lyra,一种结合 FPGA 硬件加速与语义感知生成模型(LyraGen)的 RISC-V 验证框架,通过并发执行和高质量指令序列生成,显著提升了覆盖率并大幅加速了验证收敛速度。

Juncheng Huo, Yunfan Gao, Xinxin Liu, Sa Wang, Yungang Bao, Xitong Gao, Kan Shi

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Lyra 的新系统,它的任务是给现代电脑芯片(特别是 RISC-V 架构的处理器)做“体检”和“压力测试”,以发现其中的设计漏洞。

为了让你轻松理解,我们可以把芯片验证的过程想象成训练一只寻找宝藏的猎犬,而 Lyra 就是那个超级聪明的训练师和训练场

1. 以前的痛点:笨办法和慢动作

在 Lyra 出现之前,验证芯片主要有两个大麻烦:

  • 太慢了(软件模拟的瓶颈):
    以前的方法就像是在用算盘去跑超级计算机的模拟。工程师们在普通的电脑软件里运行测试,每跑一步都要花很长时间。这就像是用蜗牛的速度去跑马拉松,效率极低。
  • 太盲目了(随机生成的缺陷):
    以前的测试工具(Fuzzing)就像是一个喝醉的猴子在键盘上乱敲。它会随机生成指令,希望能碰巧触发芯片的某个隐藏错误。
    • 比喻: 想象你要测试一扇复杂的防盗门。醉猴子的方法是随机乱按密码,虽然按得够多,但很难按出那种“先按 A,再按 B,同时按住 C"这种有逻辑的复杂组合。它只能发现表面的问题,却很难发现深藏在门后机关里的致命漏洞。

2. Lyra 的解决方案:AI 大脑 + 超级跑道

Lyra 提出了一个“双管齐下”的绝妙方案,结合了人工智能(AI)硬件加速

A. 聪明的训练师:LyraGen(AI 模型)

Lyra 训练了一个专门的 AI 模型,叫 LyraGen

  • 它不是瞎猜: 这个 AI 不像醉猴子那样乱按。它像是一个精通密码学的老侦探。它学习了 RISC-V 指令集的所有规则(语义),知道什么样的指令组合是合法的,什么样的组合能触发复杂的逻辑。
  • 比喻: 如果醉猴子是乱按密码,LyraGen 就是根据门的设计图纸,专门设计那些最难解的“逻辑锁”来测试门。它能生成有质量、有逻辑的测试指令,直接攻击芯片最薄弱的环节。

B. 超级跑道:FPGA 硬件加速

Lyra 不再用普通的电脑软件来运行测试,而是把测试场搬到了 FPGA(现场可编程门阵列) 上。

  • 并行双跑: 在 FPGA 上,Lyra 同时运行两个东西:一个是待测试的芯片设计(DUT),另一个是标准的参考模型(REF)。
  • 实时裁判: 它们像两个短跑运动员在跑道上并排跑。FPGA 里的硬件裁判会实时对比两者的每一步动作。如果芯片跑偏了(出错了),裁判立刻就能发现。
  • 比喻: 以前是用算盘算结果(慢),现在是用F1 赛车在专业赛道上跑(快)。而且,Lyra 把整个测试过程(生成指令、运行、检查)都搬到了这个高速赛道上,速度提升了成千上万倍。

3. 它是如何工作的?(三个步骤)

  1. 训练阶段(学习规则):
    Lyra 先让 AI 在“模拟赛道”上学习。它观察什么样的指令能覆盖更多的芯片功能(就像猎犬学会了哪些路径有宝藏)。AI 学会了如何把指令拆解成一个个“积木块”(Token),并理解它们之间的逻辑关系。
  2. 生成阶段(出题):
    训练好的 AI 开始出题。它不再是随机生成,而是根据刚才学到的“覆盖地图”,专门生成那些能触发芯片深层逻辑的复杂指令序列。
  3. 执行与修正(实战):
    • 安检员: AI 生成的指令可能会有一些小瑕疵(比如地址不对)。Lyra 有一个“安检员”模块,会快速检查并修正这些错误,确保指令合法。
    • 高速测试: 修正后的指令被送入 FPGA 跑道。芯片和参考模型同时高速运行,硬件实时比对。
    • 反馈循环: 如果发现了新的功能点(覆盖率提升),这个信息会立刻反馈给 AI,让它下次生成更难的题目。

4. 效果有多惊人?

论文中的实验数据非常震撼:

  • 速度提升: 相比以前最先进的软件方法,Lyra 的端到端验证速度提升了 107 倍到 3343 倍
    • 比喻: 以前跑完一场测试需要跑一年,现在 Lyra 只需要跑一天甚至几小时
  • 发现更多漏洞: 在同样的测试时间内,Lyra 发现的芯片功能覆盖率高出了 27%。这意味着它能挖出更多深藏的“地雷”。
  • 更省力: 以前为了覆盖一个难点,可能需要生成几百万个随机指令;Lyra 只需要很少的、高质量的指令就能达到同样的效果。

总结

Lyra 就像是为芯片验证配备了一位“全知全能的 AI 教练”和一条“光速跑道”。

它不再依赖笨拙的随机尝试,而是用 AI 理解芯片的“语言”,生成高智商的测试题;同时利用 FPGA 硬件让测试过程快如闪电。这不仅大大降低了芯片开发的成本和时间,也让未来的开源芯片(如 RISC-V)更加安全可靠。