iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

Each language version is independently generated for its own context, not a direct translation.

Imagine que projetar um chip de computador moderno (como os do seu celular) é como construir uma cidade gigante e complexa. Para organizar essa cidade, os engenheiros usam um "idioma de comando" muito específico chamado Tcl. É como se eles tivessem que escrever milhares de instruções manuais para dizer ao computador onde colocar cada prédio (transistor), como conectar as ruas (fios) e como garantir que a energia chegue a todos sem causar um apagão.

O problema é que escrever essas instruções manualmente é lento, chato e exige um conhecimento tão especializado que poucos engenheiros conseguem fazer isso bem. É como tentar escrever um manual de instruções para um foguete espacial usando apenas um dicionário de palavras comuns.

Aqui entra o iScript, o "herói" desta história.

O Que é o iScript?

O iScript é um assistente de inteligência artificial (IA) treinado especificamente para falar a língua dos engenheiros de chips. Pense nele como um "estagiário genial" que foi treinado não com livros de história ou receitas de bolo, mas apenas com manuais técnicos de construção de chips.

O grande desafio era que não existiam muitos exemplos públicos dessas instruções (os dados eram escassos e secretos). Então, os criadores do iScript tiveram uma ideia brilhante: eles criaram seus próprios dados de treinamento.

Como eles ensinaram o iScript? (A Fábrica de Dados)

Como não havia livros suficientes, eles construíram uma "fábrica de receitas":

Coleta de Ingredientes: Eles pegaram manuais técnicos e fóruns de discussão para entender quais comandos existiam.
Montagem Aleatória (e Bagunçada): Usaram robôs para misturar esses comandos aleatoriamente, criando milhões de "frases" em Tcl. Muitas estavam erradas, como tentar montar um carro misturando peças de uma bicicleta.
O Inspetor de Qualidade (Linting): Um programa especial varreu todas essas frases e jogou fora as que estavam com erros de gramática (sintaxe).
O Professor Inteligente (Back-Inference): Aqui está a mágica. Eles usaram uma IA superpoderosa (como um professor sábio) para olhar as frases corretas e perguntar: "Que pergunta o engenheiro fez para receber essa resposta?".
- Exemplo: A IA vê o comando set_place_mode e o professor deduz: "O engenheiro deve ter pedido: 'Coloque as células de forma eficiente'".
O Raciocínio (Chain-of-Thought): O professor também escreveu o "passo a passo" do pensamento. Não basta dar a resposta; é preciso explicar por que aquela resposta foi escolhida.

No final, eles tiveram 10.000 exemplos perfeitos de: Pergunta + Pensamento Lógico + Resposta Correta.

O Treinamento (Escola de Especialização)

Com esses dados, eles treinaram o iScript em duas etapas:

Imersão: O modelo leu milhares de scripts para aprender a "gramática" do Tcl, como um aluno que aprende a falar um novo idioma antes de tentar escrever poesia.
Prática com Explicação: O modelo aprendeu a responder às perguntas dos engenheiros, mas obrigatoriamente explicando o raciocínio antes de dar o código. Isso o torna mais confiável e menos propenso a alucinações.

O Teste de Prova (iScript-Bench)

Para saber se o iScript realmente aprendeu, eles criaram um exame de qualificação chamado iScript-Bench.

O exame tem perguntas de 5 áreas diferentes (como "desenhar o mapa da cidade" ou "consertar o trânsito").
As perguntas têm 3 níveis de dificuldade: Fácil (uma linha de código), Médio (várias linhas) e Difícil (lógica complexa).

Como corrigir o exame sem um computador real?
Rodar esses scripts em um chip real é caro e demorado (como testar um foguete real a cada erro de escrita). Então, eles usaram uma estratégia de dois passos:

Verificação de Gramática: Um robô simples verifica se o código tem erros óbvios de sintaxe.
Verificação de Significado: Uma segunda IA (o "professor") lê o código gerado e compara com o que o engenheiro pediu, usando manuais técnicos para entender se a lógica faz sentido.

Os Resultados

Quando colocaram o iScript para competir contra as IAs mais famosas do mundo (como GPT-4, Gemini, Claude), o resultado foi impressionante:

As IAs gerais (que sabem de tudo um pouco) falharam miseravelmente nos comandos específicos de chips. Elas escreviam código que parecia inglês, mas não funcionava na "língua" do chip.
O iScript venceu em quase todas as categorias. Ele não só escreveu o código correto, mas também explicou o raciocínio.
Mesmo nas perguntas mais difíceis, onde as outras IAs desistiam, o iScript ainda conseguia acertar uma parte significativa das respostas.

Conclusão

Em resumo, o iScript é como ter um engenheiro sênior disponível 24 horas por dia que não comete erros de digitação e entende perfeitamente as regras complexas de construção de chips.

A lição principal é: IAs genéricas são ótimas para conversar, mas para tarefas muito específicas e técnicas, você precisa de um especialista treinado com dados do mundo real (ou dados criados inteligentemente). Isso vai acelerar a criação de chips mais rápidos e eficientes no futuro, tornando a tecnologia acessível a mais pessoas.

iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

O Que é o iScript?

Como eles ensinaram o iScript? (A Fábrica de Dados)

O Treinamento (Escola de Especialização)

O Teste de Prova (iScript-Bench)

Os Resultados

Conclusão

Título: iScript: Um Modelo de Linguagem Grande Adaptado a Domínio e Benchmark para Geração de Scripts Tcl de Design Físico

1. O Problema

2. Metodologia

3. Principais Contribuições

4. Resultados Experimentais

5. Significado e Conclusão

iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

O Que é o iScript?

Como eles ensinaram o iScript? (A Fábrica de Dados)

O Treinamento (Escola de Especialização)

O Teste de Prova (iScript-Bench)

Os Resultados

Conclusão

Título: iScript: Um Modelo de Linguagem Grande Adaptado a Domínio e Benchmark para Geração de Scripts Tcl de Design Físico

1. O Problema

2. Metodologia

3. Principais Contribuições

4. Resultados Experimentais

5. Significado e Conclusão

Mais como este

Online Monitoring of Metric Temporal Logic using Sequential Networks

Module checking of pushdown multi-agent systems

Probabilistic Counters for Privacy Preserving Data Aggregation

Homomorphisms of (n,m)-graphs with respect to generalised switch

Agent based decision making for Integrated Air Defense system