Beyond Semantic Similarity: Open Challenges for Embedding-Based Creative Process Analysis Across AI Design Tools

Die Arbeit argumentiert, dass herkömmliche embeddings-basierte Ähnlichkeitsmaße kreative Wendepunkte in KI-gestützten Designprozessen übersehen, und identifiziert drei zentrale Herausforderungen sowie kontextbewusste Interventionen mittels großer Sprachmodelle als Lösungsansatz für eine domänenübergreifende Analyse.

Seung Won Lee, Semin Jin, Kyung Hoon Hyun

Veröffentlicht Tue, 10 Ma
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🎨 Wenn KI-Design-Tools wie ein blinder Fotograf sind

Stell dir vor, du und eine KI arbeiten zusammen an einem kreativen Projekt – vielleicht entwerfen sie gemeinsam ein neues Möbelstück oder eine App. Um zu verstehen, wie gut diese Zusammenarbeit funktioniert, schauen wir uns den Entstehungsprozess an.

Bisher haben wir oft nur das Endergebnis bewertet (Ist der Stuhl schön?). Dieses Paper sagt aber: „Nein, wir müssen uns den Weg ansehen, den ihr gegangen seid."

Das Problem: Der „Wort-Verwechslungs"-Fehler

Derzeit nutzen Forscher eine spezielle Technologie (sogenannte Embeddings), die wie ein sehr oberflächlicher Wörterbuch-Kommissar funktioniert. Dieser Kommissar schaut sich an, was du sagst, und vergleicht es mit dem, was du vorher gesagt hast.

Das Problem: Der Kommissar ist zu oberflächlich.
Stell dir vor, du bist Architekt:

  1. Du sagst: „Ich brauche gestapelte Module für kleine Wohnungen." (Du meinst: Stühle, die man stapeln kann, um Platz zu sparen).
  2. Später sagst du: „Ich brauche gestapelte Module für veränderbare Zimmerwände." (Du hast eine geniale Idee: Die Wände selbst sollen sich bewegen!).

Für den Computer-Kommissar sind diese beiden Sätze fast identisch, weil beide das Wort „gestapelte Module" enthalten. Er denkt: „Aha, der Architekt arbeitet nur weiter an derselben Idee!"
Aber in Wirklichkeit hast du einen riesigen kreativen Sprung gemacht! Du hast das Problem komplett neu gedacht (von „Stuhl" zu „Wand"). Der Computer übersieht diesen genialen Moment, weil er nur auf die Wörter achtet, nicht auf die Bedeutung hinter den Ideen.

Die drei großen Herausforderungen (Die „Drei Monster")

Die Autoren des Papers sagen, dass wir drei große Hürden überwinden müssen, damit die Analyse wirklich klug wird:

1. Der Unterschied zwischen „Ähnlich" und „Wichtig"

  • Die Metapher: Stell dir vor, du fährst mit dem Auto. Der Computer sieht nur, dass du immer noch auf der Straße bist. Er merkt nicht, dass du gerade von einer geraden Autobahn auf eine kurvige Bergstraße gewechselt bist, weil du eine neue Landschaft entdecken wolltest.
  • Die Lösung: Wir brauchen eine „intelligente Übersetzer-KI" (wie ein großes Sprachmodell), die den Kontext versteht. Sie muss erkennen: „Moment, obwohl die Wörter ähnlich klingen, hat sich das Ziel des Designs gerade komplett verändert."

2. Das Puzzle aus verschiedenen Welten (Multimodalität)

  • Die Metapher: Bisher schauen wir uns nur die Textnachrichten an, die du schreibst. Aber Design ist mehr als Text! Es sind Skizzen, Bilder, Pinselstriche und Klicks.
  • Das Problem: Ein Computer kann zwei Bilder vergleichen und sagen: „Die sehen ähnlich aus." Aber das bedeutet nicht, dass sie im kreativen Prozess ähnlich sind. Ein grober, kritzliges Skizze und ein perfektes 3D-Modell sehen völlig unterschiedlich aus, gehören aber zur gleichen Idee. Umgekehrt können zwei fast gleiche Bilder völlig verschiedene Ideen repräsentieren.
  • Die Frage: Wie teilen wir den Prozess in sinnvolle Stücke ein? Ist ein einziger Pinselstrich ein Schritt? Oder erst die ganze Skizze plus die KI-Antwort? Das ist wie ein Puzzle, bei dem wir noch nicht wissen, wie viele Teile es gibt.

3. Wenn die KI selbst mitdenkt (Agente-Systeme)

  • Die Metapher: Früher war die KI wie ein Werkzeug (ein Hammer), das du benutzt hast. Jetzt wird die KI zum Mitarbeiter, der selbst entscheidet, was als Nächstes passiert.
  • Das Problem: Wenn die KI selbst entscheidet, welche Ideen sie vorschlägt, und dabei dieselben oberflächlichen Messmethoden nutzt, die wir oben beschrieben haben, dann wird sie sich selbst täuschen. Sie könnte denken: „Ich habe viele verschiedene Ideen vorgeschlagen, also bin ich kreativ!" Dabei hat sie nur zufällig viele Variationen produziert, ohne echten kreativen Fortschritt.
  • Die Gefahr: Wir können dann nicht mehr unterscheiden, ob der Mensch kreativ war oder ob die KI nur zufällig viele Dinge rausgeworfen hat.

Was schlagen die Autoren vor?

Sie wollen nicht aufgeben, sondern eine neue Brille aufsetzen.

Statt nur starre Computer-Algorithmen zu nutzen, schlagen sie vor, große Sprachmodelle (wie moderne KI-Chatbots) als „Kontext-Experten" einzusetzen. Diese Experten sollen den Prozess analysieren und sagen:

  • „Okay, hier hat sich die Idee geändert, auch wenn die Wörter gleich blieben."
  • „Hier ist eine Skizze, die eine völlig neue Richtung bedeutet."

Zusammenfassend:
Wir wollen KI-Design-Tools nicht nur danach bewerten, wie schön das Endergebnis ist, sondern wie kreativ der Weg dorthin war. Aber unsere aktuellen Messwerkzeuge sind zu dumm dafür. Sie sehen nur die Oberfläche. Wir brauchen intelligente Helfer, die die Seele des kreativen Prozesses verstehen, damit wir wirklich vergleichen können, wie gut verschiedene KI-Tools funktionieren – egal ob beim Design von Stühlen, Schriftarten oder Apps.