OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"OpenClaw PRISM"**이라는 새로운 시스템을 소개합니다. 이 시스템을 쉽게 이해하기 위해, **거대한 쇼핑몰 (LLM 에이전트)**과 그 안에 들어온 **보안 요원 (PRISM)**의 이야기를 상상해 보세요.

🏢 배경: 쇼핑몰 (LLM 에이전트) 의 새로운 위험

과거의 쇼핑몰은 고객 (사용자) 이 직접 들어와서 물건을 고르는 것만 신경 썼습니다. 하지만 요즘 쇼핑몰은 훨씬 더 복잡해졌습니다.

도구 사용: 쇼핑몰 직원이 고객 대신 인터넷을 검색하고, 은행 계좌를 확인하고, 다른 가게와 대화할 수 있게 되었습니다.
새로운 위험: 이제 해커는 고객에게 직접 나쁜 말을 하는 것뿐만 아니라, 직원이 가져온 **인터넷 뉴스 기사 (검색 결과)**나 다른 가게의 편지 (도구 결과) 속에 나쁜 지시를 숨겨 넣을 수 있습니다. 직원이 그걸 보고 "아, 이걸로 은행 계좌를 털어야지!"라고 착각하게 만들 수 있는 거죠.

기존 보안 시스템은 주로 **입구 (사용자 입력)**에서만 감시했습니다. 하지만 직원이 밖으로 나가서 돌아온 뒤에는 아무도 감시하지 않아서, 해커는 그 틈을 타서 쇼핑몰을 장악할 수 있었습니다.

🛡️ 해결책: PRISM (보안 요원 팀)

이 논문이 제안하는 PRISM은 쇼핑몰을 폐쇄하거나 직원을 해고하는 것이 아닙니다. 대신, 쇼핑몰 운영 방식 (코드) 을 건드리지 않고도 들어설 수 있는 특별한 보안 요원 팀을 고용하는 것입니다.

이 팀은 다음과 같은 독특한 특징이 있습니다:

1. "이중 보안" (Zero-Fork)

보통 새로운 보안 시스템을 도입하려면 쇼핑몰의 구조를 완전히 뜯어고쳐야 (Fork) 합니다. 하지만 PRISM 은 기존 구조를 건드리지 않고 문 앞에 작은 감시 카메라와 요원들을 배치합니다. 쇼핑몰이 업그레이드되어도 이 요원들은 계속 일할 수 있습니다.

2. "10 개의 감시 지점" (Lifecycle Hooks)

PRISM 요원들은 쇼핑몰의 10 개의 핵심 지점을 24 시간 감시합니다.

입구: 고객이 들어오자마자 이상한 말투를 확인합니다.
준비실: 직원이 고객에게 답변을 작성하기 전에, "혹시 인터넷에서 가져온 글에 나쁜 지시가 숨어 있나?"를 확인합니다.
작업대: 직원이 도구를 사용할 때 (예: "이 명령어를 실행해"), "이건 위험한 명령어야!"라고 막습니다.
출구: 직원이 밖으로 보내는 메시지나 파일을 내보내기 전에, "비밀번호가 섞여 있진 않나?"를 다시 한번 검사합니다.
기타: 직원이 새로 팀을 꾸리거나, 쇼핑몰이 재시작될 때도 감시합니다.

3. "스마트한 위험 점수제" (Risk Accumulation)

PRISM 은 한 번의 실수로 바로 해고하지 않습니다.

직원이 아주 작은 실수를 하면 **"주의"**를 줍니다.
하지만 같은 직원이 계속 이상한 행동을 하거나, 여러 번의 작은 실수가 쌓이면 **"위험 점수"**가 올라갑니다.
점수가 임계치를 넘으면, 그 직원은 더 이상 중요한 작업 (비밀번호 확인, 은행 접근 등) 을 할 수 없게 제한됩니다.
시간이 지나면 점수가 서서히 줄어들어, 직원이 정상적으로 돌아오면 다시 일할 수 있게 합니다.

4. "2 단계 검사 시스템" (Hybrid Scanning)

PRISM 은 모든 것을 다 검사하는 게 아니라, 효율적으로 일합니다.

1 단계 (빠른 감시): 요원들이 눈으로 빠르게 훑어보며 "이건 의심스러워"라고 판단합니다. (휴리스틱)
2 단계 (전문가 상담): 1 단계에서 의심스러운 것이 나오면, **AI 전문가 (LLM)**에게 전화해서 "이게 진짜 나쁜 말인가?"를 물어봅니다.
이렇게 하면 모든 것을 AI 에게 물어보는 데 드는 시간과 비용을 아끼면서도, 중요한 것은 꼼꼼히 검사합니다.

5. "변조 방지 기록장" (Tamper-Evident Audit)

만약 해커가 보안 요원들의 기록을 지우거나 바꾸려고 하면, PRISM 은 **"이 기록은 변조되었습니다!"**라고 알립니다. 마치 은행 금고의 도장처럼, 한 번 기록되면 누구도 함부로 바꿀 수 없게 만들어 운영자가 나중에 사건을 재조사할 때 증거를 확보할 수 있습니다.

🎯 결론: 왜 이것이 중요한가요?

이 논문은 **"보안은 한 번의 검사로 끝나는 게 아니라, 과정 전체를 감시하는 것"**이라고 말합니다.

PRISM 은 쇼핑몰 (AI 에이전트) 을 폐쇄하지 않으면서도, 해커가 숨어든 틈을 막아줍니다.

사용자: 더 안전한 쇼핑을 즐길 수 있습니다.
운영자: 쇼핑몰 구조를 뜯어고치지 않아도 되며, 언제든 보안 정책을 업데이트하고 상황을 확인할 수 있습니다.
시스템: 해커가 한 번에 모든 것을 장악하는 것을 막아주어, 작은 실수라도 바로 잡을 수 있습니다.

즉, **PRISM 은 AI 에이전트가 안전하게 일할 수 있도록 돕는, 지능적이고 유연한 '보안 경비 시스템'**이라고 생각하시면 됩니다.

OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents

🏢 배경: 쇼핑몰 (LLM 에이전트) 의 새로운 위험

🛡️ 해결책: PRISM (보안 요원 팀)

1. "이중 보안" (Zero-Fork)

2. "10 개의 감시 지점" (Lifecycle Hooks)

3. "스마트한 위험 점수제" (Risk Accumulation)

4. "2 단계 검사 시스템" (Hybrid Scanning)

5. "변조 방지 기록장" (Tamper-Evident Audit)

🎯 결론: 왜 이것이 중요한가요?

1. 문제 정의 (Problem Statement)

2. 방법론 (Methodology)

A. 아키텍처: 제로-포크 및 사이드카 모델

B. 하이브리드 스캐닝 파이프라인

C. 세션 기반 위험 누적 및 정책 응답

D. 거버넌스 및 감사 (Governance & Audit)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents

🏢 배경: 쇼핑몰 (LLM 에이전트) 의 새로운 위험

🛡️ 해결책: PRISM (보안 요원 팀)

1. "이중 보안" (Zero-Fork)

2. "10 개의 감시 지점" (Lifecycle Hooks)

3. "스마트한 위험 점수제" (Risk Accumulation)

4. "2 단계 검사 시스템" (Hybrid Scanning)

5. "변조 방지 기록장" (Tamper-Evident Audit)

🎯 결론: 왜 이것이 중요한가요?

1. 문제 정의 (Problem Statement)

2. 방법론 (Methodology)

A. 아키텍처: 제로-포크 및 사이드카 모델

B. 하이브리드 스캐닝 파이프라인

C. 세션 기반 위험 누적 및 정책 응답

D. 거버넌스 및 감사 (Governance & Audit)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

유사한 논문

Model2Kernel: Model-Aware Symbolic Execution For Safe CUDA Kernels

Algorithmic Barriers to Detecting and Repairing Structural Overspecification in Adaptive Data-Structure Selection

Zero-Cost NDV Estimation from Columnar File Metadata

Persistence-based topological optimization: a survey

Multi-LLM Query Optimization