iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

本論文は、物理設計におけるTclスクリプト生成の課題に対処するため、データ合成パイプラインと2段階学習戦略を用いて開発されたドメイン適応型LLM「iScript」と、その性能を評価する包括的なベンチマーク「iScript-Bench」を提案し、既存の最先端モデルを上回る精度を達成したことを示しています。

Ning Xu, Zhaoyang Zhang, Senlin Shu, Lei Qi, Jiaqi Lv, Wensuo Wang, Tianhao Zhao, Chao Zhang, Zhaoliang Yang, Xiangyu Li, Zhaorui Su, Jingshan Li, Xin Geng

公開日 2026-03-06
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🏗️ 1. 背景:なぜこんな研究が必要なの?

半導体(スマホや PC の脳みそ)を作る工程は、現代では非常に複雑です。これを設計するエンジニアは、**「Tcl(テクル)」**という特殊なプログラミング言語で、何千行にも及ぶ「指示書(スクリプト)」を手書きで書いています。

  • 現状の悩み:
    • この指示書を書くのは、熟練の職人しかできません。
    • 新人が入っても、すぐに覚えられるようなものではありません。
    • 間違った指示を書くと、何十億円もする機械が壊れたり、製品が不良品になったりします。

そこで、「AI(大規模言語モデル)に書かせてしまおう!」と考えたのですが、普通の AI はこの分野に弱かったのです。

  • 理由: 半導体業界の指示書は、一般のプログラミングとは全く違う「専門用語」や「特殊なルール」ばかり。しかも、そのデータは企業秘密で公開されていないため、AI が勉強する教材が不足していました。

🤖 2. 解決策:「iScript」という新しい AI

この研究チームは、**「iScript(アイ・スクリプト)」**という、半導体設計に特化した AI を開発しました。

📚 勉強法:「独学」から「師匠との修行」へ

普通の AI は、ネット上の一般的なデータで勉強しただけです。しかし、iScript は以下のような特別なトレーニングを受けました。

  1. 教材の自作(データ合成):
    公開されていない教材がないので、チームは「AI 同士」を使って、指示書(スクリプト)と、それを作るための「思考プロセス(CoT)」を大量に作り出しました。
    • 例え話: 料理のレシピ本がないので、シェフ(AI)に「この料理を作った手順を逆算して、レシピと『なぜこうしたのか』という理由」を 1 万個も作ってもらい、それを教材にしたようなものです。
  2. 2 段階トレーニング:
    • 第 1 段階(語彙力アップ): まず、Tcl という言語の「文法」や「単語」を徹底的に覚えさせます。
    • 第 2 段階(思考力アップ): 次に、「ユーザーの要望(例:『ここを広くして』)」を聞いて、どうすればいいかを論理的に考え、指示書を書く練習をさせます。

📝 3. 評価:「本当に正しいの?」をどうチェックする?

AI が作った指示書が正しいかどうかをチェックするのは、半導体業界では非常に難しい問題です。

  • 問題点: 実際の機械(高価な半導体製造装置)で動かしてテストするのは、時間もお金もかかりすぎて現実的ではありません。
  • 解決策(2 ステップ検証):
    1. 文法チェック(静的検証): 言葉の使い方が間違っていないか、軽いテスト環境でチェックします。
    2. 意味チェック(AI による評価): 文法が合っているものだけを、もう一人の「AI 審査員」に見せます。この審査員は、専門知識を持って「この指示書は、本当にユーザーの要望を満たしているか?」を判断します。

🏆 4. 結果:iScript の活躍

チームは「iScript-Bench」という、半導体設計のテスト問題集も作りました。これを使って、iScript と他の有名な AI(GPT-4 や Gemini など)を比べました。

  • 結果:
    • iScript が圧勝! 文法の正しさも、意味の正しさも、他の AI よりもはるかに高いスコアを出しました。
    • 特に、難しい問題(L3 レベル)になると、他の AI はほとんど正解できなくなりましたが、iScript はまだ正解していました。

💡 まとめ:何がすごいのか?

この研究のすごいところは、「データがないから AI は作れない」という常識を覆した点です。

  • データ不足を AI で補う: 教材がないなら、AI 同士で教材を作り出す。
  • 専門特化: 汎用的な AI に、業界の「暗黙のルール」や「思考の癖」を徹底的に叩き込んだ。
  • 信頼できる評価: 高価な機械を使わずに、AI 同士で正確さをチェックする方法を開発した。

日常の例えで言うと:
「料理の名人になるには、何十年も修行が必要だ」と言われていたのに、**「AI に『なぜそうするのか』という理由まで含めた 1 万個のレシピと、その理由を徹底的に学ばせたところ、新人でもプロ並みの料理が作れるようになった」**という感じです。

これにより、半導体設計の現場では、新人でもすぐに指示書が書けるようになり、開発スピードが劇的に上がることが期待されています。