Dissecting clinical reasoning failures in frontier artificial intelligence using 10,000 synthetic cases
Diese Studie nutzt 10.000 synthetische Multiple-Sklerose-Fälle, um kritische Sicherheitslücken und klinische Denkfehler bei führenden KI-Modellen aufzudecken, die bei herkömmlichen kleinen Tests unentdeckt blieben, und fordert daher groß angelegte Simulationen als Standard vor dem klinischen Einsatz.