ContextBench: Modifying Contexts for Targeted Latent Activation
Le papier présente ContextBench, un benchmark évaluant la capacité à générer des entrées linguistiquement fluides activant des comportements ou caractéristiques latentes spécifiques dans les modèles de langage, et démontre que des variantes améliorées de l'optimisation évolutive de prompts surpassent les méthodes actuelles pour équilibrer efficacité d'élicitation et fluidité.