Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases
Este artigo propõe uma reavaliação das abordagens atuais para casos de segurança de IA de fronteira, identificando limitações nas metodologias existentes da comunidade de alinhamento e oferecendo um novo quadro teórico e prático, fundamentado em lições de indústrias de segurança crítica, para desenvolver argumentos de segurança mais robustos e defensáveis, com foco em riscos como alinhamento enganoso e capacidades CBRN.