Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases
Cet article propose de repenser les fondements des dossiers de sécurité pour les systèmes d'IA de pointe en intégrant des méthodologies rigoureuses issues des industries critiques, afin de combler les lacunes des approches actuelles de l'alignement et d'établir un cadre plus robuste et défendable, illustré par une étude de cas sur l'alignement trompeur et les capacités CBRN.