Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents
이 논문은 오픈핸즈 실행 로그를 기반으로 안전 게이트가 적용된 실행 가능한 행동 트리 (GBT) 를 추출하여 생성 대신 트리 탐색을 제어 정책으로 활용함으로써, 에이전트의 성공률을 획기적으로 높이고 안전 위반을 거의 제로로 줄이며 비용을 절감하는 'Traversal-as-Policy' 프레임워크를 제안합니다.