Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?
Este artigo reavalia o benchmark EVMbench, demonstrando que, devido a limitações metodológicas como contaminação de dados e falta de controle de scaffolding, os agentes de IA atuais não são estáveis nem capazes de exploração completa em incidentes reais, indicando que a auditoria automatizada total ainda não é viável e que a colaboração humano-IA permanece essencial.