iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

O artigo apresenta o iScript, um modelo de linguagem adaptado ao domínio de design físico e um benchmark correspondente, que superam os modelos de linguagem gerais na geração de scripts Tcl para o EDA ao utilizar um pipeline de síntese de dados multiestágio e uma estratégia de treinamento em duas etapas para mitigar a escassez de dados e garantir alta confiabilidade.

Ning Xu, Zhaoyang Zhang, Senlin Shu, Lei Qi, Jiaqi Lv, Wensuo Wang, Tianhao Zhao, Chao Zhang, Zhaoliang Yang, Xiangyu Li, Zhaorui Su, Jingshan Li, Xin Geng

Publicado 2026-03-06
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que projetar um chip de computador moderno (como os do seu celular) é como construir uma cidade gigante e complexa. Para organizar essa cidade, os engenheiros usam um "idioma de comando" muito específico chamado Tcl. É como se eles tivessem que escrever milhares de instruções manuais para dizer ao computador onde colocar cada prédio (transistor), como conectar as ruas (fios) e como garantir que a energia chegue a todos sem causar um apagão.

O problema é que escrever essas instruções manualmente é lento, chato e exige um conhecimento tão especializado que poucos engenheiros conseguem fazer isso bem. É como tentar escrever um manual de instruções para um foguete espacial usando apenas um dicionário de palavras comuns.

Aqui entra o iScript, o "herói" desta história.

O Que é o iScript?

O iScript é um assistente de inteligência artificial (IA) treinado especificamente para falar a língua dos engenheiros de chips. Pense nele como um "estagiário genial" que foi treinado não com livros de história ou receitas de bolo, mas apenas com manuais técnicos de construção de chips.

O grande desafio era que não existiam muitos exemplos públicos dessas instruções (os dados eram escassos e secretos). Então, os criadores do iScript tiveram uma ideia brilhante: eles criaram seus próprios dados de treinamento.

Como eles ensinaram o iScript? (A Fábrica de Dados)

Como não havia livros suficientes, eles construíram uma "fábrica de receitas":

  1. Coleta de Ingredientes: Eles pegaram manuais técnicos e fóruns de discussão para entender quais comandos existiam.
  2. Montagem Aleatória (e Bagunçada): Usaram robôs para misturar esses comandos aleatoriamente, criando milhões de "frases" em Tcl. Muitas estavam erradas, como tentar montar um carro misturando peças de uma bicicleta.
  3. O Inspetor de Qualidade (Linting): Um programa especial varreu todas essas frases e jogou fora as que estavam com erros de gramática (sintaxe).
  4. O Professor Inteligente (Back-Inference): Aqui está a mágica. Eles usaram uma IA superpoderosa (como um professor sábio) para olhar as frases corretas e perguntar: "Que pergunta o engenheiro fez para receber essa resposta?".
    • Exemplo: A IA vê o comando set_place_mode e o professor deduz: "O engenheiro deve ter pedido: 'Coloque as células de forma eficiente'".
  5. O Raciocínio (Chain-of-Thought): O professor também escreveu o "passo a passo" do pensamento. Não basta dar a resposta; é preciso explicar por que aquela resposta foi escolhida.

No final, eles tiveram 10.000 exemplos perfeitos de: Pergunta + Pensamento Lógico + Resposta Correta.

O Treinamento (Escola de Especialização)

Com esses dados, eles treinaram o iScript em duas etapas:

  1. Imersão: O modelo leu milhares de scripts para aprender a "gramática" do Tcl, como um aluno que aprende a falar um novo idioma antes de tentar escrever poesia.
  2. Prática com Explicação: O modelo aprendeu a responder às perguntas dos engenheiros, mas obrigatoriamente explicando o raciocínio antes de dar o código. Isso o torna mais confiável e menos propenso a alucinações.

O Teste de Prova (iScript-Bench)

Para saber se o iScript realmente aprendeu, eles criaram um exame de qualificação chamado iScript-Bench.

  • O exame tem perguntas de 5 áreas diferentes (como "desenhar o mapa da cidade" ou "consertar o trânsito").
  • As perguntas têm 3 níveis de dificuldade: Fácil (uma linha de código), Médio (várias linhas) e Difícil (lógica complexa).

Como corrigir o exame sem um computador real?
Rodar esses scripts em um chip real é caro e demorado (como testar um foguete real a cada erro de escrita). Então, eles usaram uma estratégia de dois passos:

  1. Verificação de Gramática: Um robô simples verifica se o código tem erros óbvios de sintaxe.
  2. Verificação de Significado: Uma segunda IA (o "professor") lê o código gerado e compara com o que o engenheiro pediu, usando manuais técnicos para entender se a lógica faz sentido.

Os Resultados

Quando colocaram o iScript para competir contra as IAs mais famosas do mundo (como GPT-4, Gemini, Claude), o resultado foi impressionante:

  • As IAs gerais (que sabem de tudo um pouco) falharam miseravelmente nos comandos específicos de chips. Elas escreviam código que parecia inglês, mas não funcionava na "língua" do chip.
  • O iScript venceu em quase todas as categorias. Ele não só escreveu o código correto, mas também explicou o raciocínio.
  • Mesmo nas perguntas mais difíceis, onde as outras IAs desistiam, o iScript ainda conseguia acertar uma parte significativa das respostas.

Conclusão

Em resumo, o iScript é como ter um engenheiro sênior disponível 24 horas por dia que não comete erros de digitação e entende perfeitamente as regras complexas de construção de chips.

A lição principal é: IAs genéricas são ótimas para conversar, mas para tarefas muito específicas e técnicas, você precisa de um especialista treinado com dados do mundo real (ou dados criados inteligentemente). Isso vai acelerar a criação de chips mais rápidos e eficientes no futuro, tornando a tecnologia acessível a mais pessoas.