COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics
COLD-Steer es un marco sin entrenamiento que controla el comportamiento de los modelos de lenguaje grandes en tiempo de inferencia mediante la aproximación de las dinámicas de aprendizaje de un solo paso en contexto, logrando una alta efectividad de dirección con 50 veces menos ejemplos que los métodos anteriores.