CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

本文提出了 CktEvo,这是一个针对真实世界 IP 核的仓库级 RTL 代码基准测试与参考框架,旨在通过结合 LLM 编辑与工具链反馈的闭环系统,在保持功能正确性的同时实现跨文件依赖的功耗、性能和面积(PPA)优化。

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 CktEvo 的新项目,它的核心目标是教人工智能(AI)如何像一位经验丰富的“芯片老手”一样,去优化复杂的电子电路设计。

为了让你更容易理解,我们可以把芯片设计想象成装修一套巨大的、由成千上万个房间组成的摩天大楼

1. 背景:现在的 AI 能做什么?不能做什么?

  • 以前的 AI(像只会写单句的实习生):
    目前的 AI 擅长根据你的一句话指令(比如“写一个闹钟的代码”),生成一段独立的、功能正确的代码。这就像让实习生写一个完美的“单句标语”或者“单个房间的设计图”。

    • 问题: 如果让 AI 去装修整栋大楼,它往往会“幻觉”(胡编乱造),或者只关注局部,忽略了整栋楼的水电管网是否通畅。它不知道改了厨房的墙,会不会导致客厅的承重出问题。
  • 工业界的现状(像住在拥挤的老房子里):
    真实的芯片设计(RTL 代码)就像一套已经建好的、非常复杂的摩天大楼。工程师们为了省电、省空间、跑得快(也就是论文里说的 PPA:功耗、性能、面积),已经在这套设计里反复打磨了很久。虽然它现在能住人(功能正常),但可能还有很多“死角”没利用好,或者走廊太宽浪费了面积。

2. CktEvo 是什么?(一个“装修优化”的竞技场)

CktEvo 就是为了解决这个问题而建立的基准测试(Benchmark)

  • 它的任务: 不是让 AI 从零开始盖楼(生成新代码),而是给 AI 一套已经建好但不够完美的旧大楼(现有的芯片代码库),要求 AI 在不改变大楼功能(不能把卧室改成厕所)的前提下,通过微调,让大楼更省电、跑得更快、占地更小。
  • 它的规模: 以前测试 AI 只给一个小房间(单个模块),CktEvo 直接给 AI 11 套完整的、包含几十个房间的“大楼”(从简单的 CPU 到复杂的网络处理器)。这就像让 AI 去优化整个社区的管网,而不是只修一个水龙头。

3. CktEvo 是怎么工作的?(一个“闭环装修队”)

论文设计了一套自动化的“装修流程”,让 AI 和专业的“装修监理”(EDA 工具)配合工作:

  1. 体检(EDA 工具链): 先让专业的“监理”(电子设计自动化工具)给大楼做全面体检,找出哪里漏水(延迟高)、哪里墙砌得太厚(面积大)。
  2. 找痛点(图分析器): 系统把这些体检报告翻译成 AI 能看懂的“地图”,标出哪些具体的房间(代码片段)是瓶颈。
  3. 出方案(AI 设计师): AI 看着地图,提出修改方案。比如:“把走廊的墙拆掉一点”或者“把两个小房间合并”。
  4. 试装修(代码修改): AI 真的动手改代码。
  5. 严检(形式化验证): 这是最关键的一步!改完后,必须用严格的数学方法证明:大楼的功能完全没变(比如闹钟还是能响,不会变成微波炉)。如果功能变了,方案直接作废。
  6. 再体检(迭代): 如果功能没问题,再看新大楼是不是真的更省空间了。如果是,就保留这个方案,继续下一轮优化。

这个过程就像一个不知疲倦的装修队,在“修改 -> 检查 -> 再修改”的循环中,一点点把大楼打磨得完美。

4. 实验结果:AI 真的行吗?

论文用这套方法测试了不同的 AI 模型(比如 DeepSeek-v3, GPT-4o 等),结果令人惊喜:

  • 真金白银的优化: 在开源工具链下,AI 自动优化后的芯片,整体效率(面积×延迟)平均提升了 10.5%。这意味着芯片可以做得更小、更快,或者更省电。
  • 擅长“微调”: AI 特别擅长发现那些人类工程师容易忽略的“小细节”。比如把一些啰嗦的写法改成更简洁的写法,或者把串行的操作改成并行的。
  • 商业工具的挑战: 当使用工业界顶级的商业工具(像最贵的装修队)时,提升幅度变小了(约 1.7%)。这是因为商业工具本身就很强,把能优化的都优化了。但即便如此,AI 依然能在一些特定设计(如音频处理)上再挤出 10% 的性能,这在芯片行业已经是巨大的胜利了。

5. 总结与意义

CktEvo 的核心贡献在于:

  1. 从“写代码”转向“改代码”: 它证明了 AI 不仅能生成新代码,更能像资深工程师一样,对现有的复杂系统进行迭代式优化
  2. 跨文件协作: 它解决了 AI 以前“只见树木不见森林”的问题,让 AI 能理解整个代码库(整栋大楼)的依赖关系。
  3. 未来的方向: 虽然现在的 AI 还只能做“局部装修”,但 CktEvo 为未来 AI 成为“首席架构师”(能进行整体结构改造)打下了坚实的基础。

一句话总结:
CktEvo 就像给 AI 发了一套复杂的旧房子图纸,并配上了严格的监理,教它如何在不破坏房子结构的前提下,通过反复微调,把房子装修得更省钱、更宽敞、更舒适。这是迈向“全自动芯片设计”的重要一步。