EVMbench: Evaluating AI Agents on Smart Contract Security
Ce papier présente EVMbench, une nouvelle méthode d'évaluation mesurant la capacité des agents IA à détecter, corriger et exploiter des vulnérabilités dans des contrats intelligents, révélant qu'ils sont déjà capables d'attaquer des instances de blockchain réelles de bout en bout.