COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics
O artigo apresenta o COLD-Steer, um framework livre de treinamento que controla o comportamento de Grandes Modelos de Linguagem (LLMs) em tempo de inferência ao aproximar as mudanças de representação resultantes do aprendizado em contexto, alcançando alta eficácia de direcionamento com até 50 vezes menos exemplos do que os métodos existentes.