A framework for assessing the capabilities of code generation of constraint domain-specific languages with large language models

Dit artikel introduceert een generiek raamwerk om de prestaties van grote taalmodellen bij het genereren van code voor domeinspecifieke taalvarianten, zoals OCL en Alloy, te evalueren en vergelijkt deze met die voor Python, waarbij wordt geconcludeerd dat de prestaties lager zijn en dat strategieën zoals codeherstel en meerdere pogingen de kwaliteit kunnen verbeteren.

David Delgado, Lola Burgueño, Robert Clarisó2026-03-06💻 cs

Large-scale, Independent and Comprehensive study of the power of LLMs for test case generation

Deze grootschalige studie concludeert dat hoewel reasoning-based prompting (zoals GToT) de betrouwbaarheid en leesbaarheid van door LLM's gegenereerde unit-tests verbetert, de hoge rate aan compilatiefouten en testgeurproblemen de noodzaak onderstreept voor hybride benaderingen die LLM-generatie combineren met automatische validatie.

Wendkûuni C. Ouédraogo, Kader Kaboré, Yinghua Li + 5 more2026-03-05💻 cs