Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?
Este estudio reevalúa el benchmark EVMbench y demuestra que, debido a limitaciones metodológicas como la contaminación de datos y la falta de estabilidad, los agentes de IA actuales no están listos para la auditoría automatizada completa de contratos inteligentes, sino que funcionan mejor como herramientas de apoyo dentro de un flujo de trabajo con supervisión humana.