Moral Preferences of LLMs Under Directed Contextual Influence
Este estudo demonstra que influências contextuais direcionadas alteram significativamente as decisões morais de modelos de linguagem em dilemas do tipo "problema do bonde", revelando que a neutralidade de base não prevê a sensibilidade a viéses e que o raciocínio pode, paradoxalmente, amplificar certos efeitos de influência.