AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems

이 논문은 AI 에이전트 시스템의 구조화된 UI 프로토콜에서 스키마 검사를 통과하지만 사용자를 속이는 행동적 이상을 탐지하기 위해, 4,000 개의 레이블이 지정된 페이로드 데이터셋을 구축하고 다양한 이상 탐지 모델을 평가한 'AegisUI' 프레임워크를 제안합니다.

Mohd Safwan Uddin, Saba Hajira

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"AegisUI"**라는 새로운 보안 시스템을 소개합니다. 쉽게 말해, **"AI 가 만들어내는 화면을 감시하는 '경비원'"**에 대한 이야기입니다.

과거에는 AI 가 단순히 "텍스트"로 답변을 했지만, 이제는 AI 가 버튼, 입력창, 차트 등 화면 (UI) 을 직접 만들어 사용자에게 보여줍니다. 문제는 이 화면을 만드는 명령서 (데이터) 가 겉보기엔 완벽해 보여도, 속에는 위험한 함정이 숨어있을 수 있다는 점입니다.

이 논문의 내용을 일상적인 비유로 설명해 드릴게요.


1. 문제: "완벽한 위장술"을 쓰는 사기꾼들

상상해 보세요. 은행에 방문해서 새로운 ATM 기계를 사용하려고 합니다.

  • 정상적인 기계: "입금" 버튼을 누르면 돈이 들어가고, "인출" 버튼을 누르면 돈이 나옵니다.
  • 위험한 기계 (공격): 겉모습은 정상 ATM 과 똑같습니다. 버튼 모양, 글씨, 색상까지 모두 정상입니다. 하지만 '인출' 버튼을 누르면 실제로는 내 통장 잔고를 모두 지우는 명령이 실행됩니다.

기존의 보안 시스템은 이 기계가 "공식 인증을 받은 부품으로 만들어졌는지"만 확인합니다. (예: 버튼이 3 개인가? 글씨가 한글인가?) 하지만 **"이 버튼이 누르면 실제로 무슨 일이 일어나는지"**는 확인하지 못합니다. 그래서 사기꾼은 겉보기엔 완벽하지만 속은 썩은 '가짜 ATM'을 만들어낼 수 있습니다.

2. 해결책: AegisUI (에이전트 UI)

저자들은 이 문제를 해결하기 위해 AegisUI라는 시스템을 만들었습니다. 이 시스템은 화면이 사용자에게 표시되기 직전에 그 명령서를 검사하는 초능력을 가진 경비원과 같습니다.

  • 작동 원리: AI 가 "이 화면을 만들어줘"라고 명령할 때, AegisUI 는 그 명령서를 받아서 18 가지의 특징을 분석합니다.
    • 예시: "버튼이 너무 많지는 않은가?", "이 버튼의 이름이 '결제하기'인데, 실제 동작은 '계정 삭제'는 아닌가?", "비밀번호 입력창이 갑자기 생겼는가?" 등을 체크합니다.

3. 실험: 4,000 개의 가짜 주문서로 훈련

이 경비원 (AI 모델) 을 훈련시키기 위해 저자들은 4,000 개의 가짜 주문서를 만들었습니다.

  • 3,000 개: 정상적인 주문서 (안전함).
  • 1,000 개: 해커가 변조한 주문서 (위험함).
    • 위험한 유형 예시:
      1. 사기성 인터페이스: "안전한 인증"이라는 버튼을 만들어 비밀번호를 훔치는 경우.
      2. 데이터 유출: "월급"이라는 데이터를 일반 사용자에게 보여주는 실수.
      3. 조작된 UI: "승인" 버튼 뒤에 "계정 삭제" 기능을 숨긴 경우.

이 데이터를 바탕으로 세 가지 다른 '경비원' (AI 모델) 을 시험해 보았습니다.

4. 결과: 누가 가장 잘했을까?

세 가지 모델을 비교한 결과는 다음과 같습니다.

  1. 랜덤 포레스트 (Random Forest): 가장 뛰어난 경비원.

    • 특징: 과거의 사기 사례 (라벨링된 데이터) 를 모두 공부했습니다.
    • 성적: 100 점 만점에 93 점의 정확도를 보였습니다. 거의 실수가 없었습니다.
    • 약점: 사기 사례를 미리 많이 공부해야만 작동합니다.
  2. 오토인코더 (Autoencoder): 직관력이 뛰어난 경비원.

    • 특징: 사기 사례를 단 한 번도 보지 못했습니다. 오직 '정상적인 행동'만 공부했습니다.
    • 성적: 76 점 정도를 받았습니다.
    • 장점: 새로운 시스템이 처음 시작되어 사기 기록이 없을 때, "정상적인 패턴"만 보고 "이상한 것"을 찾아낼 수 있어 매우 실용적입니다.
  3. 아이솔레이션 포레스트 (Isolation Forest): 초보 경비원.

    • 특징: 데이터의 모양이 이상하면 의심하는 방식입니다.
    • 성적: 55 점으로 가장 낮았습니다. 겉모습은 정상인데 속만 변조된 사기꾼을 잘 잡아내지 못했습니다.

5. 핵심 교훈: "작은 변조"가 가장 위험하다

가장 흥미로운 발견은 **"가장 작은 변조가 가장 잡아내기 어렵다"**는 것입니다.

  • 잡기 쉬운 것: 화면에 불필요한 버튼이 50 개나 붙어있거나, 구조가 너무 복잡하게 꼬인 경우 (겉모습이 확실히 다름).
  • 잡기 어려운 것: 화면은 정상인데, '확인' 버튼 하나만 '삭제'로 바꾼 경우. 전체 화면의 99% 는 정상이라서 AI 가 "아, 이건 정상이다"라고 착각하기 쉽습니다.

6. 결론 및 미래

이 논문은 **"AI 가 만드는 화면을 보호하려면, 단순히 문법 (형식) 만 체크하는 게 아니라, 행동 (의도) 을 분석해야 한다"**는 것을 증명했습니다.

  • 현재: AegisUI 는 합성된 데이터로 실험했지만, 랜덤 포레스트나 오토인코더 같은 기존 기술로도 충분히 위험을 감지할 수 있음을 보였습니다.
  • 미래: 더 정교하게 잡기 위해, 개별 버튼 하나하나를 분석하거나, 사용자가 화면을 조작하는 **순서 (시퀀스)**까지 분석하는 더 똑똑한 AI 를 만들 계획입니다.

한 줄 요약:

"AI 가 만들어주는 화면이 겉보기엔 완벽해도, 속은 위험할 수 있습니다. AegisUI 는 그 **속뜻 (행동)**을 읽어내어 사용자를 사기꾼으로부터 보호하는 새로운 보안 시스템입니다."

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →