Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek

Seek-CAD 是一种无需训练的本地化生成方法,它利用 DeepSeek-R1 结合视觉与思维链反馈进行自我优化,并基于 SSR 设计范式构建数据集,从而高效生成工业级 3D 参数化 CAD 模型。

Xueyang Li, Jiahao Li, Yu Song, Yunzhong Lou, Xiangdong Zhou

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Seek-CAD 的新系统,它的核心目标是:让 AI 像一位经验丰富的老工匠一样,自动画出复杂的 3D 工业零件图纸(CAD 模型),而且不需要专门“培训”它,直接就能用。

为了让你更容易理解,我们可以把整个过程想象成**“一位天才设计师(DeepSeek-R1)在画图纸,旁边站着一位严格的质检员(Gemini-2.0),两人通过‘边画边看’的方式合作,直到图纸完美为止。”**

以下是用通俗语言和比喻对这篇论文核心内容的解读:

1. 背景:以前的 AI 画图纸有什么难处?

  • 传统方法(微调):就像为了教 AI 画图纸,必须把它关在教室里,给它看几万张图纸,让它死记硬背。这很费钱、费时间,而且一旦遇到新类型的图纸,它可能就傻了。
  • 现在的痛点:虽然现在的 AI(大语言模型)很聪明,能写代码、能聊天,但让它们直接画复杂的 3D 零件时,它们容易“想当然”。比如,它可能画了一个圆柱体,但忘了在圆柱体上打个孔,或者孔的位置不对。以前的 AI 缺乏一种**“边思考、边检查、边修正”**的机制。

2. Seek-CAD 是怎么工作的?(核心三招)

Seek-CAD 不需要重新训练,它直接利用现有的强大 AI 模型,通过以下三个步骤来“自我进化”:

第一招:本地“小抄” + 天才设计师 (DeepSeek-R1)

  • 比喻:想象 DeepSeek-R1 是一个天才设计师,但他以前没画过这种特定的零件。
  • 做法:系统里有一个本地数据库(就像设计师手边的“参考书”或“小抄”)。当用户说“我要画一个带孔的圆柱体”时,系统先查一下“小抄”,找到类似的例子,然后让设计师参考这些例子,写出第一版代码(图纸)。
  • 特点:这是**“零训练”**的,设计师不需要重新上学,直接拿着参考书就能干活。

第二招:边画边看,分步检查 (Step-wise Visual Feedback)

  • 比喻:这是 Seek-CAD 最厉害的地方。以前的 AI 是“一气呵成”画完整个图,最后才给质检员看。如果画错了,质检员只能看到最终结果,不知道是哪一步错了。
  • 做法:Seek-CAD 让设计师**“分步画”**。
    1. 先画个草图(Sketch)。
    2. 再把它拉成 3D 形状(Extrude)。
    3. 最后加个倒角(Fillet)。
    • 每画一步,系统就立刻渲染出一张图片给质检员(Gemini-2.0)看。
  • 关键创新:质检员不仅看最终图,还要看中间过程图。这就好比老师改作业,不仅看最后答案,还要看解题步骤。如果中间步骤错了(比如草图画歪了),质检员能立刻指出来:“不对,你第一步的草图方向反了!”

第三招:逻辑与视觉的“对暗号” (CoT + VLM)

  • 比喻:设计师(DeepSeek-R1)在画图时,会一边画一边自言自语(Chain-of-Thought,思维链),比如:“第一步我要画个圆,第二步我要把它拉长……"
  • 做法:质检员(Gemini-2.0)会拿着设计师的**“自言自语”“分步渲染图”**进行对比。
    • 如果设计师说“我要画个圆”,但图里是个方块,质检员就会说:“你嘴上说画圆,但画出来是方块,请修正!”
    • 设计师收到反馈后,会修改代码,重新画,直到“说的”和“画的”完全一致。

3. 新的“积木”玩法:SSR 范式

  • 旧玩法:以前的 AI 画零件,只能像搭简单的积木(先画个平面,再拉高),很难画出复杂的工业零件(比如带倒角、倒圆、挖空等)。
  • 新玩法 (SSR):Seek-CAD 发明了一种新的**“积木规则”**,叫 SSR(草图 + 特征 + 修饰)。
    • 这就好比以前只能搭“方块”,现在可以搭“带圆角的方块”、“带孔的方块”、“带倒角的方块”。
    • 为了让 AI 知道怎么在复杂的形状上打孔或倒角,他们还设计了一个**“定位器” (CapType)**,就像给零件上的每个角落都贴了标签,告诉 AI:“在这个标签的位置打孔”,这样 AI 就不会搞错位置了。

4. 效果如何?

  • 更准:在测试中,Seek-CAD 画出来的零件,和真实工业设计的相似度非常高(几何精度提升)。
  • 更聪明:它能处理非常复杂的指令,比如“画一个带孔的圆柱,孔要切掉一部分,还要倒角”,以前的 AI 可能会晕,但 Seek-CAD 能通过“分步检查”一步步搞定。
  • 更省钱:因为它不需要重新训练模型,直接利用现有的开源模型(DeepSeek-R1)和视觉模型(Gemini),大大降低了开发成本。

总结

Seek-CAD 就像是给 AI 设计师配了一个**“分步检查员”和一个“参考书”
它不再让 AI 蒙着眼睛画完整个图,而是让 AI
“想一步、画一步、看一步、改一步”。通过这种“自我修正”**的机制,AI 终于能画出符合工业标准、结构复杂且精准的 3D 零件图纸了,而且不需要花费巨资去专门训练它。

这对于未来的智能制造、自动化设计来说,是一个巨大的进步,意味着未来的工厂里,AI 可能真的能像人类工程师一样,从零开始设计复杂的机器零件。