The Fragility Of Moral Judgment In Large Language Models
Este estudo demonstra que os julgamentos morais de modelos de linguagem grandes são altamente instáveis e manipuláveis, dependendo mais da estrutura narrativa, da perspectiva e do protocolo de avaliação do que da substância moral dos dilemas, o que levanta sérias preocupações sobre reprodutibilidade e equidade.