Patch Validation in Automated Vulnerability Repair
Deze paper introduceert PVBench, een benchmark die aantoont dat meer dan 40% van de door automatische kwetsbaarheidsreparatiesystemen als correct beoordeelde patches falen wanneer ze worden getest met uitgebreide PoC+-tests, wat wijst op een kritieke onderbenutting van developer intenties en specificaties in de huidige validatiemethoden.