원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기
당신이 새로운 레시피를 요리하려는 셰프라고 상상해 보세요. 당신은 초지능 AI 기반의 부주방장에게 도움을 요청합니다. 부주방장은 자신 있게 말합니다. "슈퍼스파이스-9000을 식료품점에서 사야 합니다!" 당신은 식료품점에 가지만, 슈퍼스파이스-9000은 존재하지 않습니다.
컴퓨터 프로그래밍 세계에서는 이 '식료품점'이 PyPI(파이썬용) 또는 npm(자바스크립트용)이라는 디지털 창고입니다. 이러한 창고에는 프로그래머가 단일 명령어로 다운로드할 수 있는 수백만 개의 미리 만들어진 코드 '재료'(패키지)가 보관되어 있습니다.
이 논문은 작년에 들려준 무서운 이야기의 후속편입니다. 당시 연구원들은 AI 셰프들이 재료 이름을 짓는 데 매우 서툴렀다는 사실을 발견했습니다. 그들은 약 5%에서 22%의 빈도로 '슈퍼스파이스-9000'과 같은 가짜 이름을 만들어냈습니다. 교활한 도둑은 그 가짜 이름으로 악성 패키지를 등록한 뒤, 프로그래머가 AI에게 그것을 요청하도록 기다렸다가 프로그래머를 속여 바이러스를 설치하게 만들 수 있었습니다. 이를 **'슬로스쿼팅(slopsquatting)'**이라고 부릅니다.
이 논문의 저자인 독립 연구자는 질문했습니다. "2 년이 지났는데 AI 는 이 부분에서 나아졌을까?"
그들이 발견한 내용을 간단히 설명하면 다음과 같습니다:
1. '가짜 재료' 문제는 줄어들었지만 사라지지는 않음
연구원들은 2026 년 초에 이용 가능한 다섯 가지 가장 똑똑한 AI 코딩 모델 (Anthropic, OpenAI, Google, DeepSeek 등 기업 소속) 을 테스트했습니다.
- 좋은 소식: '최고' AI 와 '최악' AI 간의 격차가 극적으로 줄었습니다. 2024 년에는 일부 AI 가 끔찍하게도 (가짜 이름 비율 22%) 다른 일부는 그럭저럭 (5%) 이었습니다. 하지만 2026 년에는 모두 대략 비슷해졌습니다. 모두 약 **4.6% 에서 6.1%**의 빈도로 가짜 이름을 만들어냅니다. '나쁨'의 분포가 무너졌습니다.
- 나쁜 소식: 위협은 여전히 매우 현실적입니다. 비율이 떨어졌지만 4~6% 는 도둑이 수익을 낼 만큼 여전히 높습니다. AI 가 20 번 중 1 번 가짜 이름을 만들어낸다면, 도둑은 그 가짜 이름을 등록하고 수천 명의 프로그래머가 실수로 다운로드할 때까지 기다릴 수 있습니다.
2. '보편적 가짜' 발견
이 논문이 가진 가장 큰 놀라움입니다. 연구원들은 127 개의 특정 가짜 이름을 발견했는데, 이는 상위 5 개 AI 모델이 모두 발명한 이름들이었습니다.
- 비유: 다섯 명의 다른 전문가 셰프에게 "이 수프의 비밀 재료는 무엇인가요?"라고 물었을 때, 그 재료가 존재하지 않음에도 불구하고 다섯 명 모두 독립적으로 "그건 블루플래버-7입니다"라고 말한다고 상상해 보세요.
- 위험성: 도둑이 '블루플래버-7'을 한 번만 등록해도, 다섯 개 AI 회사의 사용자들을 동시에 공격할 수 있습니다. 이는 어떤 AI 를 사용하든 상관없이 작동하는 '보편적 함정'입니다.
3. 몇 가지 기이한 반전
논문은 우리가 예상했던 것과 반대되는 몇 가지 패턴을 발견했습니다:
- 파이썬 vs 자바스크립트: 2024 년에는 AI 가 자바스크립트 재료 이름을 짓는 데 더 서툴렀습니다. 하지만 2026 년에는 오히려 파이썬 재료 이름을 짓는 데 더 서툴러졌습니다. AI 는 파이썬의 엉망진창인 이름 규칙에 혼란을 겪는 것 같습니다.
- '작은' 형제 vs '큰' 형제: 보통 작고 저렴한 AI 모델은 크고 비싼 모델보다 실수가 더 많습니다. 하지만 여기서는 '작은' 모델 (Claude Haiku) 이 '큰 형제'(Claude Sonnet) 보다 오히려 가짜 이름을 덜 만들었습니다. 작은 모델이 지시사항에 특히 조심하도록 훈련된 것으로 보입니다.
4. 왜 문제가 줄어들었을까?
저자는 AI 가 지금 약간 더 나아진 데에는 세 가지 이유가 있다고 제안합니다:
- 공정한 경쟁 환경 조성: '오픈소스' 모델 (무료 사용) 이 매우 좋아져서 이제 '상용' 모델 (유료) 과 똑똑해졌으므로, 그들 간의 격차가 좁혀졌습니다.
- 더 나은 훈련: AI 에 데이터를 공급하는 기업들이 가짜 재료 이름을 더 많이 제거하기 위해 '요리책'(훈련 데이터) 을 정리한 것 같습니다.
- 표준화된 훈련: 모든 주요 AI 기업이 이제 유사한 교육 방법을 사용하고 있으므로, 모두 비슷하게 (조금 더 나아진) 실수를 저지릅니다.
결론
AI 셰프들은 조금은 행동을 정리했지만, 여전히 위험할 정도로 자주 가짜 재료를 만들어냅니다. 가장 걱정스러운 점은 그들이 모두 같은 가짜 재료를 만들어낸다는 것입니다.
이 논문이 말하지 않는 것:
- 이것이 해결된 문제라고 말하지 않습니다.
- AI 사용을 중단해야 한다고 말하지 않습니다.
- 모든 AI 모델이 나쁘다고 주장하지 않습니다 (그들은 상위 5 개 '최첨단' 모델만 테스트했습니다. 작고 오래된 모델들은 여전히 훨씬 나쁠 수 있습니다).
저자의 주요 메시지는 다음과 같습니다: 오류의 범위는 줄어들었지만, 위협은 여전히 존재합니다. 프로그래머와 보안 팀은 오늘날 가장 똑똑한 AI 조차도 여전히 가짜이고 위험한 다운로드로 이끌 수 있다는 점을 인지해야 합니다.
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.