Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?
Cette étude remet en question la fiabilité du benchmark EVMbench en démontrant que les agents d'IA actuels, dont les performances varient selon la configuration et sont limitées par des risques de contamination des données, ne peuvent pas encore remplacer l'audit humain mais doivent être intégrés dans un flux de travail collaboratif pour la sécurité des contrats intelligents.