Malicious Or Not: Adding Repository Context to Agent Skill Classification

이 논문은 23 만 개 이상의 에이전트 스킬을 분석하여 기존 스캐너의 높은 악성 비율 (46.8%) 이 오히려 허위 양성 (False Positive) 이었음을 밝히고, 리포지토리 컨텍스트를 고려한 분석을 통해 악성 스킬 비율을 0.52% 로 재평가함과 동시에 버려진 GitHub 리포지토리를 통한 새로운 공격 벡터를 발견했습니다.

Florian Holzbauer, David Schmidt, Gabriel Gegenhuber, Sebastian Schrittwieser, Johanna Ullrich

게시일 2026-03-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 인공지능 (AI) 이 스스로 작업을 수행할 때 사용하는 '도구 상자' (스킬) 들의 안전성을 조사한 흥미로운 연구입니다. 마치 스마트폰에 앱을 설치하듯, AI 에이전트도 다양한 '스킬'을 설치해서 더 똑똑하게 만들 수 있는데, 이 과정에서 어떤 위험이 있는지, 그리고 우리가 얼마나 잘못 걱정하고 있는지 밝혀냈습니다.

이 연구의 핵심 내용을 일상적인 비유로 설명해 드릴게요.

1. 상황: 거대한 '앱 스토어'와 공포심

마치 스마트폰에 앱을 설치할 때처럼, AI 에이전트 (클로드 코드, 오픈클로 등) 도 '스킬'이라는 부가 기능을 설치합니다. 이 스킬들은 외부 API 를 연결하거나 코드를 실행하는 등 AI 의 능력을 확장해 줍니다.

하지만 문제는 이 스킬들이 해커에게 악용될 수 있다는 점입니다. 그래서 각 스킬 마켓플레이스 (앱 스토어) 는 스킬을 검사합니다.

  • 기존의 결론: 검사 결과, 어떤 마켓플레이스에서는 스킬의 46.8% 나가 "악성 코드일 가능성이 높다"라고 경고했습니다. 마치 "이 앱 스토어의 앱 절반 이상이 바이러스일지도 모른다"는 공포를 느낀 것과 같습니다.

2. 연구의 발견: "너무 많이 의심하고 있었어요!"

연구진 (플로리안 홀츠바우어 교수 등) 은 "정말 절반이나 악성일까?"라는 의심을 품고, 전 세계의 스킬 23 만 8 천 개를 모두 모아서 다시 분석했습니다.

그들은 단순히 스킬 파일 하나만 보는 것이 아니라, 그 스킬이 있는 '저장소 (레포지토리)' 전체의 맥락을 보았습니다.

  • 비유: 어떤 사람이 "나는 요리사야"라고 말하며 요리 도구를 들고 왔다고 해서, 그가 바로 도둑이라고 단정 짓는 것이 아니라, 그가 사는 동네, 이웃들의 평판, 집 안의 분위기까지 모두 살펴보는 것입니다.
  • 결과: 맥락을 고려해서 다시 보니, 악성으로 의심되던 스킬은 전체의 0.52% 로 줄어듭니다. 즉, 기존 검사기들은 **너무 많은 '가짜 경보 (False Positive)'**를 울리고 있었던 것입니다.

3. 새로운 위협: "유령 집"을 사기 당하다

연구진은 새로운 위험도 발견했습니다. 바로 **'버려진 저장소 (Abandoned Repository) 해킹'**입니다.

  • 비유: 어떤 사람이 예전에 만든 '유령 집' (더 이상 관리되지 않는 GitHub 저장소) 이 있습니다. 그런데 그 집 주소에 '스킬'이 연결되어 있습니다. 만약 집주인이 집을 비우고 나가버리면, 해커가 그 빈집을 차지해서 '유령 집'을 '악의적인 아지트'로 바꿀 수 있습니다.
  • 실제 사례: 연구진은 121 개의 스킬이 이런 '유령 집'을 가리키고 있음을 발견했습니다. 해커가 그 집을 다시 장악하면, 사용자는 모르고 해커가 만든 악성 코드를 실행하게 됩니다.

4. 결론: 더 똑똑한 보안이 필요하다

이 논문은 우리에게 두 가지 중요한 교훈을 줍니다.

  1. 과도한 경계는 독이 됩니다: 단순히 파일 하나만 보고 "위험하다"고 막으면, 진짜 유용한 도구들을 쓸 수 없게 됩니다. **맥락 (Context)**을 봐야 합니다. 그 스킬이 어떤 프로젝트의 일부인지, 개발자는 누구인지, 주변 환경은 안전한지 확인해야 진짜 위험을 알 수 있습니다.
  2. 새로운 함정이 있습니다: AI 스킬 시장이 아직 어리기 때문에, '버려진 주소'를 노리는 해킹 수법이 생겼습니다. 마켓플레이스 운영자들은 이 점을 주의해야 합니다.

한 줄 요약:

"AI 의 도구 (스킬) 가 위험하다고 해서 모두 의심하기보다, 그 도구가 어디에서 왔는지, 어떤 맥락에서 쓰이는지 살펴보면 실제 위험은 생각보다 훨씬 적지만, '버려진 집'을 노리는 새로운 사기 수법이 있다는 것을 알아냈습니다."

이 연구는 AI 생태계가 성장하는 과정에서 불필요한 공포를 줄이고, 진짜 위험에 집중할 수 있는 더 현명한 보안 방식을 제안합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →