The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift
Este artigo demonstra que a detecção de desvios graduais em agentes de RL baseados em modelos de mundo ocorre apenas acima de um limiar crítico universal (), cuja posição é determinada pela interação entre a sensibilidade do detector, a estrutura do ruído e a dinâmica do ambiente, revelando que certos tipos de desvio (como os sinusoidais) são intrinsecamente indetectáveis e que ambientes frágeis podem colapsar antes que qualquer monitoramento seja acionado.