Controllable and explainable personality sliders for LLMs at inference time
Este trabalho apresenta o Sequential Adaptive Steering (SAS), um framework modular que permite o controle contínuo e explicável de múltiplas traços de personalidade em Grandes Modelos de Linguagem durante a inferência, superando a interferência vetorial de métodos anteriores ao ortogonalizar vetores de direção para síntese precisa de perfis sem necessidade de re-treinamento.