iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat het ontwerpen van een moderne computerchip (zoals die in je smartphone) net zo complex is als het bouwen van een hele stad, maar dan in een ruimte kleiner dan een vingernagel. Om deze "stad" te bouwen, gebruiken ingenieurs een speciaal gereedschap genaamd Innovus. Maar om dit gereedschap te laten doen wat ze willen, moeten ze het besturen met een vreemde taal: Tcl.

Tcl is als een heel specifieke, oude dialect dat alleen door experts wordt gesproken. Als je één verkeerd woordje gebruikt, kan de hele stad (de chip) instorten.

Hier is wat dit paper, iScript, doet, vertaald naar alledaags taalgebruik:

1. Het Probleem: De "Taalbarrière"

Vroeger moesten ingenieurs elke regel code zelf typen. Dat is saai, foutgevoelig en duurt eeuwen.
Recentelijk zijn er slimme computers (AI's) gekomen die tekst kunnen schrijven, zoals een super-intelligente chatbot. Maar als je deze algemene chatbots vraagt om Tcl-code te schrijven voor chipontwerp, gaan ze het volledig mis.

Waarom? Omdat ze die specifieke "Tcl-dialect" nooit hebben gehoord. Het is alsof je een Fransman vraagt om in het Japans een recept te schrijven voor een heel specifiek gerecht. Hij kent de grammatica, maar niet de ingrediënten.
Het gebrek aan data: Er zijn ook heel weinig voorbeelden van goede Tcl-code beschikbaar op internet, omdat bedrijven hun geheimen bewaken. De AI heeft dus niets om van te leren.

2. De Oplossing: iScript (De Speciale Leraar)

De onderzoekers hebben een nieuwe AI gebouwd genaamd iScript. Ze hebben dit niet zomaar gedaan; ze hebben een slimme drie-stappenplan gebruikt om de AI te trainen:

Stap 1: De "Kookboek" Generator (Data Synthese)
Omdat er geen echte recepten (code) genoeg zijn, hebben ze een AI gebruikt om duizenden mogelijke recepten te bedenken door commando's te mixen en te matchen.
Stap 2: De "Keurmeester" (Static Syntax Check)
Een computer heeft al die nieuwe recepten gecontroleerd. Als er een grammaticafout in zat, werd het recept weggegooid. Alleen de perfect geschreven code bleef over.
Stap 3: De "Uitlegger" (Chain-of-Thought)
Dit is het slimste deel. Ze hebben een andere, super-slimme AI gevraagd om voor elk goed recept een uitleg te schrijven.
- Voorbeeld: "Ik heb dit commando gebruikt omdat we eerst de basis moesten leggen voordat we de muren konden bouwen."
- Zo leerde iScript niet alleen wat er moet worden getypt, maar ook waarom. Het leerde het redeneren achter de code.

Het resultaat is een AI die niet alleen de taal spreekt, maar ook begrijpt wat de ingenieur eigenlijk wil bereiken.

3. De Test: iScript-Bench (De Examenhal)

Hoe weet je of de AI het echt goed doet? Je kunt niet elke chip die de AI ontwerpt fysiek bouwen; dat is te duur en te langzaam.
Dus hebben de onderzoekers een examen bedacht (iScript-Bench):

Ze hebben 116 verschillende taken gemaakt, variërend van "vraag me iets over de chip" (makkelijk) tot "ontwerp een complexe stroomkring" (heel moeilijk).
Ze hebben een tweestaps-controle bedacht:
1. De Grammatica-check: Kijkt de code wel kloppend? (Net als een spellingcontrole).
2. De Logica-check: Een andere AI (die ook veel weet over chips) leest de code en zegt: "Ja, dit doet wat de opdrachtgever wilde."

4. De Resultaten: De Nieuwe Kampioen

Toen ze iScript lieten strijden tegen de bekendste AI's ter wereld (zoals GPT-4, Gemini en Claude), gebeurde er iets opmerkelijks:

De grote, algemene AI's faalde vaak. Ze schreven code die er mooi uitzag, maar die technisch onzin was voor chipontwerp.
iScript won overtuigend. Het schreef niet alleen code die geen fouten had, maar ook code die daadwerkelijk werkte voor de ingenieurs. Zelfs bij de moeilijkste taken bleef iScript veel beter presteren dan de concurrenten.

Samenvattend

Stel je voor dat je een meester-bouwer nodig hebt om een stad te bouwen.

De oude manier: Je leert de bouwer alles zelf, regel voor regel.
De algemene AI: Je vraagt een wiskundig genie om te bouwen, maar die heeft nog nooit een baksteen vastgehouden.
iScript: Je neemt dat genie, geeft hem een jaar lang een opleiding in de bouw, leert hem de specifieke bouwregels van die ene stad, en laat hem oefenen met duizenden voorbeelden waarbij iemand uitlegt waarom elke baksteen op zijn plek ligt.

Dit paper laat zien dat als je AI's specifiek traint voor een heel moeilijke, specifieke taak (zoals chipontwerp), ze veel beter zijn dan de "alles-kunners". Het opent de deur voor een toekomst waar ingenieurs minder tijd kwijt zijn aan typen en meer tijd hebben voor creatief ontwerpen.

iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

1. Het Probleem: De "Taalbarrière"

2. De Oplossing: iScript (De Speciale Leraar)

3. De Test: iScript-Bench (De Examenhal)

4. De Resultaten: De Nieuwe Kampioen

Samenvattend

Probleemstelling

Methodologie

1. Data Synthese Pipeline

2. Trainingsstrategie (CPT + SFT)

3. Evaluatie Framework (Tweestapsverificatie)

Belangrijkste Bijdragen

Resultaten

Betekenis en Impact

iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation

1. Het Probleem: De "Taalbarrière"

2. De Oplossing: iScript (De Speciale Leraar)

3. De Test: iScript-Bench (De Examenhal)

4. De Resultaten: De Nieuwe Kampioen

Samenvattend

Probleemstelling

Methodologie

1. Data Synthese Pipeline

2. Trainingsstrategie (CPT + SFT)

3. Evaluatie Framework (Tweestapsverificatie)

Belangrijkste Bijdragen

Resultaten

Betekenis en Impact

Meer zoals dit

Online Monitoring of Metric Temporal Logic using Sequential Networks

Module checking of pushdown multi-agent systems

Probabilistic Counters for Privacy Preserving Data Aggregation

Homomorphisms of (n,m)-graphs with respect to generalised switch

Agent based decision making for Integrated Air Defense system