The Alignment Flywheel: A Governance-Centric Hybrid MAS for Architecture-Agnostic Safety
Ce papier présente l'Alignement Flywheel, une architecture hybride multi-agents centrée sur la gouvernance qui découple la génération de décisions de la supervision de la sécurité pour permettre des mises à jour de sécurité localisées et auditable sans nécessiter le retrait ou le réentraînement des composants décisionnels autonomes sous-jacents.