AudAgent: Automated Auditing of Privacy Policy Compliance in AI Agents

이 논문은 AI 에이전트의 런타임 데이터 수집 및 처리 행위가 개인정보 보호 정책과 일치하는지 실시간으로 감시하고 위반 사항을 시각화하여 사용자에게 투명성을 제공하며, 민감한 정보의 오용을 방지하기 위해 에이전트의 원래 행동을 차단하는 자동화된 감사 도구인 AudAgent 를 제안하고 그 유효성을 입증합니다.

Ye Zheng, Yimin Chen, Yidan Hu

게시일 2026-03-05
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ '오디에이전트 (AudAgent)': 당신의 AI 비서가 지켜야 할 약속을 감시하는 '디지털 보안관'

이 논문은 **AI 에이전트 (AI 비서)**가 사용자의 개인정보를 어떻게 다루는지 실시간으로 감시하고, 그 회사가 약속한 '개인정보 보호 정책'을 지키는지 자동으로 확인해주는 새로운 도구인 **'오디에이전트 (AudAgent)'**를 소개합니다.

마치 AI 비서가 당신의 집을 방문할 때, 그가 가져간 물건과 한 행동을 실시간으로 기록하고, 집주인이 미리 정한 '규칙'에 어긋나지 않았는지 체크하는 보안관과 같습니다.


🏠 왜 이 도구가 필요할까요? (배경)

요즘 AI 비서 (챗봇, 자동화 도구 등) 는 당신의 이메일, 주소, 전화번호 같은 민감한 정보를 스스로 수집하고 처리합니다.

  • 문제점: AI 회사는 "우리는 당신의 정보를 이렇게만 쓸게요"라고 개인정보 보호 정책을 작성해놓지만, 실제로 AI 가 작동할 때 그 약속을 지키는지 사용자는 알 수 없습니다.
  • 비유: 식당에 갔을 때 메뉴판에 "신선한 재료만 사용합니다"라고 써있지만, 주방에서 실제로 어떤 재료를 쓰는지, 위생 상태를 확인할 수 없는 것과 비슷합니다.

🛠️ 오디에이전트는 어떻게 작동할까요? (4 단계 과정)

이 도구는 AI 가 일을 하는 동안 4 가지 단계를 거쳐 실시간으로 감시합니다.

1. 📜 약속을 '기계 언어'로 번역하기 (정책 공식화)

  • 상황: 개인정보 보호 정책은 사람이 읽는 긴 글 (자연어) 로 되어 있어 컴퓨터가 이해하기 어렵습니다.
  • 해결: 오디에이전트는 여러 개의 AI (LLM) 를 동시에 불러서 이 긴 글을 분석하게 합니다. 마치 여러 명의 전문가가 같은 문서를 읽고 합의점을 찾아내어, 컴퓨터가 이해할 수 있는 '규칙 목록'으로 정리하는 것과 같습니다.
  • 효과: 한 명의 AI 가 실수할 수 있지만, 여러 명이 투표 (Voting) 를 하면 훨씬 정확한 규칙을 만들 수 있습니다.

2. 🔍 실시간으로 '민감한 물건' 찾기 (데이터 주석 달기)

  • 상황: AI 가 이메일을 보내거나 파일을 열 때, 그 안에 '주민등록번호'나 '이메일 주소' 같은 민감한 정보가 들어있는지 모릅니다.
  • 해결: 오디에이전트는 AI 가 주고받는 모든 데이터를 실시간으로 훑어보며, 민감한 정보가 발견되면 "이건 개인정보야!"라고 스티커를 붙여줍니다. (마이크로소프트의 '프레시디오'라는 도구를 활용합니다.)
  • 비유: 공항 보안 검색대에서 X-ray 를 쏘아 가방 속의 위험물질을 찾아내고, "이건 위험물입니다"라고 표시하는 것과 같습니다.

3. ⚖️ 규칙 위반 여부 확인하기 (준수 감사)

  • 상황: AI 가 "이메일을 30 일 동안 보관한다"고 약속했는데, 실제로는 1 년 동안 보관하거나, "제 3 자에게 주지 않는다"고 했는데 광고 회사에 보낸다면 어떨까요?
  • 해결: 오디에이전트는 1 단계에서 만든 '규칙 목록'과 2 단계에서 붙인 '스티커'를 비교합니다.
    • 온톨로지 그래프: "이메일"이라는 구체적인 것이 "연락처"라는 큰 범주에 속한다는 것을 이해하게 해줍니다.
    • 자동화 (Automata): 마치 교통 신호등처럼, 규칙을 지키면 초록불 (통과), 위반하면 빨간불 (정지) 을 켭니다.
  • 결과: AI 가 약속을 어기면 즉시 경고합니다.

4. 📺 사용자에게 보여주기 (시각화)

  • 상황: 복잡한 기술적 로그를 사용자가 이해하기 어렵습니다.
  • 해결: 웹 브라우저에서 AI 가 어떤 데이터를 어디로 보냈는지, 어디에서 문제가 발생했는지 직관적인 그림과 타임라인으로 보여줍니다.
  • 비유: AI 의 행동을 CCTV 로 녹화해서, "이때 이 이메일을 광고 회사에 보냈습니다. 하지만 우리 규칙에는 금지되어 있습니다!"라고 빨간색으로 표시해 주는 것입니다.

🚨 이 도구가 발견한 놀라운 사실들 (실험 결과)

연구팀은 오디에이전트를 주요 AI 에이전트 (Claude, Gemini, DeepSeek 등) 에 적용해 보았습니다.

  1. 약속과 현실의 괴리: 많은 AI 회사의 정책에는 '주민등록번호 (SSN)' 같은 초민감 정보를 보호한다는 내용이 명시적으로 빠져있었습니다.
  2. 위험한 행동: AI 는 사용자가 "주민등록번호를 검색해줘"라고 하면, 거부하지 않고 실제로 제 3 자 도구 (검색 엔진 등) 에 그 번호를 보내는 경우가 많았습니다.
  3. 오디에이전트의 활약: 오디에이전트가 설치되면, AI 가 주민등록번호를 보내려고 시도하는 순간 자동으로 막아냅니다. AI 가 원래 하려던 행동 (약속 위반) 을 무시하고 사용자의 안전을 우선시하는 것입니다.

💡 요약: 오디에이전트가 가져오는 변화

  • 투명성: "내 데이터가 어디로 갔는지"를 AI 가 작동하는 동안 실시간으로 볼 수 있습니다.
  • 통제권: 사용자가 "이 정보는 절대 보내지 마"라고 설정하면, AI 가 실수로 보내려 해도 오디에이전트가 막아줍니다.
  • 신뢰: AI 플랫폼이 약속한 대로 데이터를 다루는지 검증할 수 있어, AI 를 더 안심하고 쓸 수 있게 됩니다.

결론적으로, 오디에이전트는 AI 비서가 당신의 개인정보를 함부로 다루지 못하게 막아주는 '디지털 경비원'이자 '감시자' 역할을 하여, 더 안전하고 신뢰할 수 있는 AI 시대를 만드는 데 기여합니다.