Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models
Questo studio presenta un nuovo framework di valutazione su larga scala che, attraverso l'iniezione di mutazioni semantiche, dimostra come la capacità dei Large Language Models di localizzare i difetti sia spesso fragile e dipenda da indizi sintattici irrilevanti piuttosto che da una profonda comprensione della semantica del programma.