ContextBench: Modifying Contexts for Targeted Latent Activation
O artigo apresenta o ContextBench, um benchmark que avalia métodos de modificação de contexto para ativar características latentes específicas em modelos de linguagem, demonstrando que variantes aprimoradas do EPO alcançam o estado da arte ao equilibrar eficazmente a força de elicitação e a fluência linguística.