Jian Yang, Wei Zhang, Jiajun Wu, Junhang Cheng, Shawn Guo, Haowen Wang, Weicheng Gu, Yaxin Du, Joseph Li, Fanglin Xu, Yizhi Li, Lin Jing, Yuanbo Wang, Yuhan Gao, Ruihao Gong, Chuan Hao, Ran Tao, Aisha

公開日 2026-03-18

📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

InCoder-32B：工業界の「職人技」を習得した AI 職人の物語

この論文は、**「InCoder-32B（インコーダー・32B）」**という新しい AI モデルの紹介です。

これまでの AI は、「一般的なプログラミング（Web サイトを作ったり、アプリを作ったり）」は得意でしたが、**「工業用・ハードウェアのプログラミング」**になると、まるで料理人が「高級和食の包丁さばき」を知らなかったように、つまずいていました。

InCoder-32B は、その「職人技」まで完璧にマスターした、世界初の 320 億パラメータを持つ**「工業用コードの万能職人」**です。

🛠️ 1. 何が違うの？「料理人」と「職人」の違い

想像してください。

普通の AI（既存モデル）： 家庭料理が得意な「料理人」です。卵焼きやパスタは完璧に作れます（一般的なコード生成）。でも、**「原子力発電所の制御システム」や「超高性能な GPU 用チップ」**の設計図を描くよう頼むと、「えっ、そんなの初めてです！」と混乱してしまいます。
InCoder-32B： 家庭料理だけでなく、**「精密機械の設計」「半導体チップの回路」「自動車の制御プログラム」**まで、あらゆる専門分野の「職人」です。

具体的な例：GPU の「グリッド」問題

論文の図 2 に面白い例があります。

従来の AI（Claude など）： 「512x512 の大きな画像処理」を頼むと、GPU の制限を無視して「無理やり大きな枠」を作ろうとし、**「エラー！壊れます！」**と失敗します。
InCoder-32B： 「あ、GPU には大きさの制限があるんだな」と理解し、**「枠を細かく分割して、制限内で最大限の効率を出す」**という、熟練のエンジニアなら考えるような「知恵」を持ってコードを書きます。

🏭 2. どのようにして「職人」になったのか？（3 つの修行）

InCoder-32B は、ただ本（データ）を大量に読んだだけでは職人になれませんでした。3 つの段階で、**「実地研修」**を積みました。

第 1 段階：資料集めと掃除（Pre-training）

何をした？ GitHub などの公開コードだけでなく、**「技術書」「マニュアル」「専門フォーラム」**まで読み漁りました。
工夫： 単にコードをコピーするだけでなく、**「このコードが実際に動いているか」**をシミュレーターでチェックし、バグのあるゴミデータを徹底的に排除しました。
イメージ： 料理学校で、単にレシピを暗記するだけでなく、**「実際に火を点けて、焦げないか、味が整うか」**を何度も確認する修行です。

第 2 段階：長文の理解と推理（Mid-training）

何をした？ 短いコードだけでなく、**「巨大なプロジェクト全体」**を理解できるように訓練しました。
工夫： 8,000 文字から 128,000 文字（本 1 冊分）のコードを一度に読めるようにし、**「なぜこのエラーが起きたのか？」「どう直せばいいか？」**という推理力を鍛えました。
イメージ： 単に「卵焼きの作り方」だけでなく、「100 人分の宴会メニューを、予算と食材の制約の中でどう組み立てるか」という**「大規模な計画力」**を身につけた状態です。

第 3 段階：実戦での検証（Post-training）

何をした？ 生成したコードを、**「実際のハードウェア（GPU やマイコン）」や「シミュレーター」**で走らせました。
工夫： 「動かないコード」が出たら、エラーメッセージを見て**「自分で直して、もう一度試す」**というループを何万回も繰り返しました。
イメージ： 料理人が、味見をして「塩が足りない」「火が強すぎた」と気づき、**「直して、また味見をする」という「失敗から学ぶ」**プロセスを AI 自体に学習させたのです。

🌟 3. 何ができるようになったの？（4 つの専門分野）

InCoder-32B は、以下の 4 つの「工業分野」で、既存の AI を凌駕する性能を発揮します。

🔩 チップ設計（半導体）：
- 電子回路の設計図（Verilog）を描くことができます。スマホの CPU や AI 用チップの設計に役立ちます。
🚀 GPU 最適化：
- AI 学習を加速させるための「超高速な計算プログラム」を、人間が手作業で書くよりも早く、効率的に作れます。
📟 組み込みシステム：
- 家電や自動車の制御プログラム（C 言語など）を、限られたメモリや電力の中で動かせるように設計できます。
📐 3D モデリング（CAD）：
- 「この部品を 3D 打印したい」という指示から、実際に 3D プリンターで出力できる設計データを作成できます。

🏆 4. 結果：オープンソース界の「最強職人」

このモデルは、**「オープンソース（誰でも使える）」**のモデルとしては、これまでにない高い性能を達成しました。

一般的なタスク： 既存の巨大モデルと互角に戦えます。
工業タスク： 有料の最高峰モデル（Claude 4.6 など）さえも凌駕する結果を出しました。

結論

InCoder-32B は、**「AI が、単なる『コードを書く機械』から、『ハードウェアの制約を理解し、実社会で使える製品を作る『エンジニア』』へと進化」**したことを示す画期的な成果です。

これにより、今後、半導体設計やロボット制御などの分野でも、AI が人間のエンジニアの**「最強の相棒」**として、より深く、より実用的に活躍できるようになるでしょう。

InCoder-32B: Code Foundation Model for Industrial Scenarios

InCoder-32B：工業界の「職人技」を習得した AI 職人の物語

🛠️ 1. 何が違うの？「料理人」と「職人」の違い

具体的な例：GPU の「グリッド」問題

🏭 2. どのようにして「職人」になったのか？（3 つの修行）

第 1 段階：資料集めと掃除（Pre-training）

第 2 段階：長文の理解と推理（Mid-training）

第 3 段階：実戦での検証（Post-training）

🌟 3. 何ができるようになったの？（4 つの専門分野）

🏆 4. 結果：オープンソース界の「最強職人」

結論

InCoder-32B: 産業シナリオ向けコード基盤モデルの技術的サマリー

1. 問題定義 (Problem)

2. 手法 (Methodology)

2.1. 段階 1: プレトレーニングとアニーリング (Pre-training & Annealing)

2.2. 段階 2: ミッドトレーニング (Mid-training)

2.3. 段階 3: ポストトレーニング (Post-training)

3. 主要な貢献 (Key Contributions)

4. 結果 (Results)

5. 意義と結論 (Significance)

InCoder-32B: Code Foundation Model for Industrial Scenarios

InCoder-32B：工業界の「職人技」を習得した AI 職人の物語

🛠️ 1. 何が違うの？「料理人」と「職人」の違い

具体的な例：GPU の「グリッド」問題

🏭 2. どのようにして「職人」になったのか？（3 つの修行）

第 1 段階：資料集めと掃除（Pre-training）

第 2 段階：長文の理解と推理（Mid-training）

第 3 段階：実戦での検証（Post-training）

🌟 3. 何ができるようになったの？（4 つの専門分野）

🏆 4. 結果：オープンソース界の「最強職人」

結論

InCoder-32B: 産業シナリオ向けコード基盤モデルの技術的サマリー

1. 問題定義 (Problem)

2. 手法 (Methodology)

2.1. 段階 1: プレトレーニングとアニーリング (Pre-training & Annealing)

2.2. 段階 2: ミッドトレーニング (Mid-training)

2.3. 段階 3: ポストトレーニング (Post-training)

3. 主要な貢献 (Key Contributions)

4. 結果 (Results)

5. 意義と結論 (Significance)

関連論文

Exploration and Exploitation Errors Are Measurable for Language Model Agents

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models

Optimizing Earth Observation Satellite Schedules under Unknown Operational Constraints: An Active Constraint Acquisition Approach

WebXSkill: Skill Learning for Autonomous Web Agents