Patch Validation in Automated Vulnerability Repair
O artigo apresenta o PVBench, um novo benchmark que revela que mais de 40% dos patches gerados por sistemas automáticos de reparo de vulnerabilidades, embora aprovados por testes básicos, falham em testes avançados (), evidenciando a necessidade de melhorar a análise de causas raízes, a aderência a especificações e a captura da intenção dos desenvolvedores.