Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek

Die Studie stellt Seek-CAD vor, ein training-freies Verfahren, das das lokal ausgeführte Open-Source-LLM DeepSeek-R1 in Kombination mit visuellem Feedback und Chain-of-Thought-Reflexion nutzt, um parametrische 3D-CAD-Modelle selbstverfeinernd zu generieren.

Xueyang Li, Jiahao Li, Yu Song, Yunzhong Lou, Xiangdong Zhou

Veröffentlicht 2026-03-03
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du möchtest einen komplexen 3D-Druck oder eine technische Zeichnung für eine Maschine erstellen. Früher musste man das alles mühsam von Hand programmieren – wie das Bauen eines Hauses Ziegel für Ziegel, ohne Bauplan.

Das Papier stellt Seek-CAD vor, ein neues Werkzeug, das wie ein super-intelligenter, selbstkorrigierender Architekt funktioniert. Hier ist die Erklärung in einfachen Worten:

1. Das Problem: Der "blinde" KI-Architekt

Künstliche Intelligenz (KI) ist heute sehr gut darin, Texte zu verstehen und Bilder zu zeichnen. Aber wenn es darum geht, präzise technische Baupläne (CAD-Modelle) zu erstellen, machen große KI-Modelle oft Fehler.

  • Das alte Problem: Frühere KIs wurden wie ein Schüler ausgebildet, der tausende Beispiele auswendig gelernt hat (Feinabstimmung). Das ist teuer und unflexibel.
  • Das neue Problem: Wenn man eine KI einfach nur "fragt", was sie bauen soll, denkt sie oft nicht Schritt für Schritt nach. Sie wirft einfach einen Entwurf hin, der vielleicht aussieht wie ein Stuhl, aber eigentlich ein Tisch ist, oder bei dem die Beine durch den Boden ragen.

2. Die Lösung: Seek-CAD (Der "Suche-und-Verbessere"-Architekt)

Seek-CAD nutzt eine spezielle KI (DeepSeek-R1), die nicht neu trainiert werden muss. Stattdessen nutzt sie eine clevere Methode, die man sich wie einen Baumeister mit einem strengen Bauleiter vorstellen kann.

Schritt 1: Der Bauplan (Der "Gedankenstrom")

Wenn du der KI sagst: "Baue einen Stuhl mit vier Beinen und einer Lehne", denkt die KI erst einmal laut nach. Sie schreibt einen Gedankenstrom (Chain-of-Thought) auf:

"Okay, zuerst zeichne ich ein Rechteck für die Sitzfläche. Dann extrudiere ich (ziehe ich hoch) die Beine. Dann füge ich die Lehne hinzu."

Schritt 2: Der Baustellen-Besuch (Schritt-für-Schritt-Ansicht)

Das ist der geniale Teil: Die KI baut das Modell nicht einfach nur als fertiges Bild. Sie zeigt dir jeden einzelnen Schritt des Bauprozesses.

  • Stell dir vor, du filmst den Bauprozess: Zuerst siehst du nur das Fundament, dann die Wände, dann das Dach.
  • Seek-CAD macht genau das: Es rendert (zeichnet) das Modell in kleinen Etappen.

Schritt 3: Der Bauleiter (Die visuelle Kontrolle)

Hier kommt ein zweiter KI-Experte (ein "Vision Language Model", wie Gemini) ins Spiel. Dieser Bauleiter schaut sich die Schritt-für-Schritt-Fotos an und vergleicht sie mit dem Gedankenstrom der ersten KI.

  • Szenario: Die erste KI dachte: "Ich baue ein Bein." Aber auf dem Foto sieht der Bauleiter: "Moment mal! Das sieht eher aus wie ein Tischbein, das schief ist, und du hast vergessen, die Querverbindung zu zeichnen."
  • Der Bauleiter sagt: "Das passt nicht! Hier ist ein Fehler."

Schritt 4: Die Selbstkorrektur

Die erste KI bekommt dieses Feedback zurück. Sie denkt sich: "Ah, ich habe einen Fehler gemacht. Ich korrigiere meinen Code und baue es nochmal."
Dieser Prozess wiederholt sich ein paar Mal, bis der Bauleiter zufrieden ist und sagt: "Perfekt, das ist ein Stuhl!"

3. Die neue Bauweise (SSR-Paradigma)

Früher haben viele Systeme nur einfache Bauklötze verwendet (z. B. "Zeichne eine Linie, ziehe sie hoch"). Seek-CAD nutzt eine neue Methode namens SSR (Skizze, Skizze-basierter Zug, Verfeinerung).

  • Vergleich: Stell dir vor, du baust mit LEGO. Die alten Systeme konnten nur einfache Türme bauen. Seek-CAD kann aber auch Nägel, Schrauben und abgerundete Ecken hinzufügen. Es versteht komplexe Details wie "diese Kante muss abgerundet sein" oder "dieses Loch muss hier genau sitzen".

4. Warum ist das wichtig?

  • Kein teures Training: Man muss die KI nicht monatelang füttern, um sie zu lernen. Sie nutzt ihr vorhandenes Wissen und korrigiert sich selbst.
  • Industrie-tauglich: Die Modelle sehen nicht nur gut aus, sie sind technisch korrekt und können von echten Maschinen verarbeitet werden.
  • Fehlervermeidung: Durch den ständigen Abgleich von "Gedanken" und "Bild" werden grobe Fehler sofort erkannt, bevor das Endergebnis fertig ist.

Zusammenfassung in einem Satz

Seek-CAD ist wie ein Architekt, der laut denkt, einen Baumeister hat, der jeden einzelnen Schritt auf der Baustelle filmt, und der sofort korrigiert, wenn das Bild nicht mit dem Plan übereinstimmt – alles ohne dass man ihm vorher tausende Beispiele zeigen musste.