Beyond Functional Correctness: Design Issues in AI IDE-Generated Large-Scale Projects

이 논문은 FD-HITL 프레임워크를 활용해 Cursor 로 생성한 대규모 프로젝트가 기능적 정확도는 높지만, 코드 중복과 복잡성 등 유지보수성을 위협하는 설계 결함을 다수 포함하고 있음을 실증적으로 규명했습니다.

원저자: Syed Mohammad Kashif, Ruiyin Li, Peng Liang, Amjed Tahir, Qiong Feng, Zengyang Li, Mojtaba Shahin

게시일 2026-04-09✓ Author reviewed
📖 3 분 읽기☕ 가벼운 읽기

이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🤖 AI 가 만든 거대 프로젝트: "일단 작동은 하는데, 집은 엉망이야?"

이 논문은 최신 AI 코딩 도구 (특히 '커서'라는 AI IDE) 가 혼자서 거대한 소프트웨어 프로젝트를 얼마나 잘 만들 수 있는지, 그리고 그 결과물이 어떤 문제점을 가지고 있는지 연구한 내용입니다.

핵심 내용을 집을 짓는 상황에 비유해서 쉽게 설명해 드릴게요.


1. 연구의 배경: AI 가 혼자 집을 지어준다면?

과거의 AI 코딩 도구는 "벽돌 하나만 쌓아줘"라고 하면 벽돌을 쌓아주는 도구 수준이었습니다. 하지만 최신 AI(커서 등) 는 "우리 집 한 채를 지어줘"라고 하면 건축가, 시공팀, 감리까지 다 맡아서 전체 프로젝트를 만들어냅니다.

연구진들은 "AI 가 혼자서 아파트 한 동 (거대 프로젝트) 을 지을 수 있을까? 그리고 그 집이 실제로 살 만한 수준일까?"라는 궁금증을 품고 실험을 시작했습니다.

2. 실험 방법: "AI 와 함께하는 체계적인 건축 계획"

AI 에게 "집 좀 지어줘"라고 막연히 말하면 AI 는 엉뚱한 것을 만들거나 중간에 멈춥니다. 그래서 연구진들은 **FD-HITL(기능 중심 인간-루프)**이라는 체계적인 건축 계획서를 만들었습니다.

  • 비유: AI 를 무작정 시키는 게 아니라, 인간 건축주가 "먼저 기초를 다지고, 그다음 1 층을 짓고, 그다음 2 층을 짓자"라고 단계별로 지시하고, AI 가 각 단계마다 "이게 맞나요?"라고 물어보면 인간이 확인하고 수정하는 방식입니다.
  • 결과: 이 방법으로 AI 는 10 개의 거대한 프로젝트 (모바일 앱, 웹사이트, 유틸리티 등) 를 성공적으로 만들었습니다. 코드 양만 해도 평균 1 만 7 천 줄이 넘었고, 파일도 100 개 이상이었습니다.

3. 핵심 발견 1: "일단 작동은 한다!" (기능적 정확성)

연구진이 직접 AI 가 만든 프로그램을 돌려보니, 약 91% 는 의도대로 작동했습니다.

  • 비유: AI 가 지은 집은 문도 잘 열리고, 수도도 잘 나오고, 침실도 있습니다. 사람이 살 수 있는 수준으로 '일단 완성'된 것입니다.

4. 핵심 발견 2: "하지만 집은 엉망진창이다!" (디자인 문제)

하지만 기능만 작동한다고 해서 좋은 집은 아닙니다. 전문가 (정적 분석 도구) 가 집을 자세히 검사하니 치명적인 문제점들이 쏟아져 나왔습니다.

  • 문제 1: 중복된 공사 (코드 중복)

    • 상황: 거실 벽을 칠할 때, 주방 벽을 칠할 때, 화장실 벽을 칠할 때 똑같은 공법과 자재를 3 번이나 따로따로 사용했습니다.
    • 문제: 나중에 벽을 고쳐야 하면 3 군데를 다 고쳐야 해서 수리비가 비싸지고 관리가 어렵습니다. (DRY 원칙 위반)
  • 문제 2: 너무 복잡한 방 (코드 복잡도)

    • 상황: 한 방 안에 벽장, 주방, 욕실, 서재 기능이 모두 섞여 있습니다. 문이 11 개나 있어서 어디로 나가야 할지 헷갈립니다.
    • 문제: 나중에 방을 개조하려면 전체를 부수고 다시 지어야 할 정도로 복잡합니다. (단일 책임 원칙 위반)
  • 문제 3: 안전 장치 부재 (예외 처리)

    • 상황: 지진이 나거나 화재가 났을 때 대피할 비상구 표시가 없거나, 비상벨이 고장 나면 아무것도 안 됩니다.
    • 문제: 작은 오류가 발생하면 전체 시스템이 멈춰버릴 위험이 큽니다.
  • 문제 4: 장애인 접근성 무시

    • 상황: 휠체어를 탄 사람이 들어갈 수 있는 경사로가 없거나, 시각 장애인을 위한 점자 표시가 없습니다.
    • 문제: 모든 사람이 편안하게 쓸 수 있는 집이 아닙니다.

5. 결론: AI 는 훌륭한 '시공 팀'이지만, '건축주'는 여전히 인간이다

이 연구는 다음과 같은 결론을 내립니다.

  1. AI 는 강력하다: 체계적인 지시 (FD-HITL) 를 받으면 AI 는 거대한 프로젝트를 빠르게 만들 수 있습니다.
  2. 하지만 품질은 낮다: AI 가 만든 코드는 기능은 작동하지만, 유지보수가 어렵고, 구조가 엉망인 경우가 많습니다.
  3. 인간의 역할: AI 는 '일꾼'일 뿐, '건축주'나 '감리자'는 여전히 유능한 인간 개발자여야 합니다. AI 가 만든 코드를 그대로 쓰면 나중에 큰 낭패를 볼 수 있습니다.

💡 일반인을 위한 교훈

"AI 가 다 해준다"라고 믿고 아무 생각 없이 코드를 받아쓰면 안 됩니다. AI 는 빠르고 많은 일을 해주는 훌륭한 비서이지만, 설계도 (아키텍처) 를 검토하고, 안전 장치를 점검하며, 깔끔하게 정리하는 일은 여전히 사람의 손이 필요합니다.

**"AI 가 지은 집은 일단 들어갈 수 있지만, 나중에 수리할 때 고생하지 않으려면 인간 건축주가 꼼꼼히 감리해야 한다"**는 것이 이 논문의 핵심 메시지입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →