Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing

이 논문은 새로운 다중 에이전트 프레임워크인 ARTEMIS 가 기존 AI 에이전트보다 우수한 성능을 보이며 인간 해커 10 명 중 9 명을 능가하는 실전 침투 테스트 결과를 제시하고, AI 는 체계적인 탐색과 비용 효율성에서 우위를 점하지만 오탐지율과 GUI 작업에서는 여전히 한계가 있음을 규명했습니다.

Justin W. Lin, Eliot Krzysztof Jones, Donovan Julian Jasper, Ethan Jun-shen Ho, Anna Wu, Arnold Tianyi Yang, Neil Perry, Andy Zou, Matt Fredrikson, J. Zico Kolter, Percy Liang, Dan Boneh, Daniel E. Ho

게시일 2026-03-04
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능 (AI) 해커가 실제 인간 해커보다 더 잘 해킹할 수 있을까?"**라는 흥미로운 질문을 던지며, 스탠포드 대학 연구팀이 진행한 대규모 실험 결과를 담고 있습니다.

이 연구는 마치 실제 대학 캠퍼스라는 거대한 성벽 안으로 AI 와 인간 해커들을 동시에 투입하여, 누가 더 많은 비밀 (취약점) 을 찾아낼지 대결을 시킨 것과 같습니다.

이 복잡한 내용을 일상적인 언어와 비유로 쉽게 설명해 드릴게요.


1. 실험 배경: 왜 이 대결을 했을까요?

최근 AI 기술이 급격히 발전하면서, "AI 가 해커의 무기가 되지 않을까?"라는 우려가 커졌습니다. 하지만 기존에 AI 의 해킹 능력을 테스트하던 방법은 마치 가상 게임 (CTF) 을 하거나, 책으로만 문제를 푸는 것과 비슷했습니다. 실제 세상은 훨씬 복잡하고 소음도 많죠.

연구팀은 **"실제 세상 (실제 대학 네트워크, 약 8,000 대의 컴퓨터)"**에서 AI 와 인간 전문가를 직접 비교해 보기로 했습니다.

2. 등장인물 소개

  • 인간 해커 (10 명): 해킹 대회 우승자나 전문 보안 회사에 다니는 베테랑들입니다. 이들은 10 시간 동안 집중해서 문제를 해결했습니다.
  • 기존 AI (Codex, CyAgent 등): 현재 상용화된 AI 도구들입니다. 이들은 마치 초보 견습생처럼, 복잡한 상황에서는 길을 잃거나 "이건 못 해"라고 거부 반응을 보였습니다.
  • 새로운 AI (ARTEMIS): 연구팀이 새로 만든 '수석 지휘관'이 있는 AI 팀입니다.
    • 비유: 기존 AI 가 혼자서 모든 일을 하느라 지쳐버린 '1 인 기업'이라면, ARTEMIS 는 **지휘관 (Supervisor) 이 수백 명의 전문 부하 (Sub-agents) 를 동시에 보내고, 중간에 성과를 점검하며 (Triage), 실패하면 다시 계획을 수정하는 '대형 해킹 회사'**입니다.

3. 대결 결과: 누가 이겼을까요?

결과는 놀라웠습니다. ARTEMIS 가 인간 전문가 10 명 중 9 명을 제치고 2 위를 차지했습니다!

  • 인간 전문가: 10 시간 동안 고생하며 평균 4~5 개의 중요한 취약점을 찾았습니다.
  • ARTEMIS: 10 시간 동안 9 개의 유효한 취약점을 찾아냈고, 인간 전문가들보다 더 많은 '진짜' 해킹 성공을 거뒀습니다.
  • 기존 AI: 대부분 인간 전문가보다 못했습니다.

💡 핵심 포인트:

  • 비용: 인간 전문가 1 시간당 비용은 약 60 달러 (약 8 만 원) 인데, ARTEMIS 는 약 18 달러 (약 2 만 4 천 원) 였습니다. 인간보다 3 배나 저렴하면서도 더 잘했습니다.
  • 전략: 인간은 한 가지 일을 꼼꼼히 하다가 다른 일을 잊어버리는 경우가 많았지만, ARTEMIS 는 동시에 여러 곳을 공격하고, 실패하면 바로 다른 전략을 세우는 '병렬 처리' 능력이 뛰어났습니다.

4. AI 의 장점과 단점 (인간 vs 로봇)

이 대결을 통해 AI 와 인간의 특징이 명확히 드러났습니다.

✅ AI 의 강점 (로봇의 특기)

  • 끝없는 반복과 병렬 작업: 인간은 피곤해지면 실수하지만, AI 는 24 시간 내내 100 개의 창을 동시에 열어두고 검색할 수 있습니다.
  • 구식 시스템 공략: 최신 웹 브라우저가 열지 않는 아주 오래된 서버 (예: 구형 IDRAC 서버) 를 찾아내서 해킹하는 데는 AI 가 더 능숙했습니다. (인간은 "브라우저가 안 열리니까 포기"했지만, AI 는 명령어 (CLI) 로 직접 접근했죠.)

❌ AI 의 약점 (로봇의 한계)

  • 그래픽 화면 (GUI) 무력: 화면에 마우스를 클릭해서 조작해야 하는 작업은 AI 가 매우 서툴렀습니다.
    • 비유: 인간은 "화면을 보고 클릭하면 되는 버튼"을 쉽게 찾지만, AI 는 "화면을 보고 클릭하는 행위"를 이해하지 못해 엉뚱한 곳을 클릭하거나 포기했습니다.
  • 오해 (False Positive): AI 는 "응답이 왔으니 성공한 거야!"라고 착각하는 경우가 많았습니다. 인간은 "아, 이건 로그인 실패 후 리디렉션된 거야"라고 바로 눈치챘지만, AI 는 이를 성공으로 신고하기도 했습니다.

5. 결론: 무엇을 의미할까요?

이 연구는 **"AI 가 해킹의 미래를 바꿀 것"**임을 보여줍니다.

  1. 방어자의 새로운 무기: 이제 기업들은 비싼 인간 해커를 고용할 필요 없이, 저렴하고 빠른 AI 도구를 이용해 스스로 자신의 시스템을 점검할 수 있게 됩니다.
  2. 위험의 증대: 만약 나쁜 의도를 가진 해커들이 이 AI 기술을 쓰면, 인간이 상상도 못 할 속도로 전 세계 시스템을 공격할 수 있습니다.
  3. 미래의 방향: AI 는 '수단'을 잘 찾지만, '맥락'을 이해하는 데는 아직 인간이 낫습니다. 따라서 인간의 눈 (GUI 이해, 직관) 과 AI 의 손 (빠른 검색, 병렬 작업) 을 합친 '하이브리드' 방식이 가장 강력한 보안이 될 것입니다.

한 줄 요약:

"이번 실험에서 AI 는 인간 전문가를 능가할 만큼 똑똑해졌지만, 아직 화면을 보고 클릭하는 '손'은 인간이 더 낫습니다. 이제 우리는 AI 를 어떻게 안전하게 다룰지, 혹은 어떻게 우리 편으로 만들어야 할지 고민해야 할 때입니다."

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →