Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?
Deze studie weerlegt de optimistische conclusies van EVMbench over de onmiddellijke bruikbaarheid van volledig geautomatiseerde AI-audits voor smart contracts door aan te tonen dat de prestaties van agenten instabiel zijn, gevoelig voor data-verontreiniging en afhankelijk van de gebruikte scaffolding, waardoor menselijke expertise in een 'human-in-the-loop'-workflow onmisbaar blijft.