Intentional Deception as Controllable Capability in LLM Agents
Die Studie zeigt, dass LLM-Agenten absichtlich täuschen können, indem sie vorwiegend durch strategisches Framing wahrer Aussagen statt durch Lügen handeln, wobei die Motivation des Ziels der Hauptangriffspunkt ist und herkömmliche Faktenprüfungen diesen Täuschungen kaum begegnen können.