RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

이 논문은 모든 프로그래밍 언어와 플랫폼에서 코드 저장소의 의존성 해결, 컴파일, 테스트 결과 추출을 자동화하는 최초의 에이전트인 'RepoLaunch'를 소개하고, 이를 통해 인간의 개입을 최소화하면서 소프트웨어 공학 데이터셋을 대규모로 생성할 수 있는 파이프라인을 제안합니다.

Kenan Li, Rongzhi Li, Linghao Zhang, Qirui Jin, Liao Zhu, Xiaosong Huang, Geng Zhang, Yikai Zhang, Shilin He, Chengxing Xie, Xin Zhang, Zijian Jin, Bowen Li, Chaoyun Zhang, Yu Kang, Yufan Huang, Elsie Nallipogu, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏗️ RepoLaunch: 모든 건물을 짓고 시험을 치르는 '만능 건축가'

1. 문제: 왜 건축이 어려울까요?

소프트웨어 개발자 (코더) 들은 매일 새로운 건물을 짓습니다. 하지만 이 건물들은 재료 (프로그래밍 언어) 가 다르고, 지어진 땅 (운영체제: 윈도우, 리눅스 등) 도 다릅니다.

  • 기존의 문제: 건물을 짓기 전에 재료를 구하고, 기초를 다지고, 벽을 세우는 과정이 매우 복잡합니다. 특히 건물이 완성되지 않았는데 시험을 치르면 "왜 안 돼?"라고 외치는 경우가 많습니다.
  • 현재의 한계: 인공지능 (LLM) 이 코딩을 잘하더라도, "일단 이 건물을 세우고, 전기를 연결하고, 시험을 치를 수 있는 상태"로 만들어주는 과정은 인간이 직접 손으로 해야 했습니다. 이는 마치 인공지능이 그림을 잘 그릴 수는 있지만, 캔버스와 물감을 준비하고 그림을 그릴 수 있는 방을 만들어주는 것은 인간이 해야 한다는 것과 같습니다.

2. 해결책: RepoLaunch 의 등장

이 논문은 RepoLaunch라는 AI 에이전트를 소개합니다. 이 친구는 다음과 같은 일을 합니다:

  • 언어와 플랫폼을 가리지 않음: 파이썬이든, 자바이든, 윈도우든 리눅스든 상관없이 "이 언어로 된 건물을 짓는 법" 을 스스로 찾아냅니다.
  • 자동화: 재료를 주문하고 (의존성 설치), 벽돌을 쌓고 (코드 컴파일), 전기를 연결하고 (테스트 실행) 하는 모든 과정을 혼자서 해냅니다.
  • 결과 확인: 건물이 제대로 지어졌는지, 그리고 안에 있는 방들 (테스트) 이 모두 정상 작동하는지 확인합니다.

비유: RepoLaunch 는 "어떤 재료가 들어오든, 어떤 땅에 놓이든, 알아서 집을 지고 전기와 수도를 연결한 뒤, '이 집이 살아있나요?'라고 확인하는 만능 건축가" 입니다.

3. 이 도구의 가장 큰 성과: '시험지' 자동 제작

이 건축가의 진짜 능력은 단순히 집을 짓는 것을 넘어, 새로운 '시험지'를 만드는 것에 있습니다.

  • 기존 방식: 인공지능을 훈련시키기 위해 "이 문제를 고쳐라"라는 과제를 만들려면, 인간이 직접 건물을 짓고, 문제를 넣고, 정답을 확인하는 과정을 수천 번 반복해야 했습니다. (매우 귀찮고 비쌈)
  • RepoLaunch 방식: 인간은 "어떤 문제를 내고 싶은지" 만 설계하면 됩니다. 나머지 모든 과정 (건물 짓기, 문제 넣기, 시험 감독, 채점) 은 RepoLaunch 가 자동으로 해냅니다.
    • 마치 수능 문제를 낼 때, 출제위원이 문제만 내면, 나머지는 AI 가 시험지를 인쇄하고, 감독하고, 채점까지 해주는 시스템과 같습니다.

4. 실험 결과: 얼마나 잘할까요?

연구팀은 이 도구를 이용해 9 가지 언어 (C, Java, Python 등) 와 윈도우/리눅스 환경에서 실험했습니다.

  • 성공률:70% 의 건물을 성공적으로 짓고 시험을 통과시켰습니다. (기존 방식보다 훨씬 뛰어남)
  • 새로운 데이터: 이를 통해 수천 개의 새로운 코딩 문제 (SWE-bench-Live) 를 자동으로 만들어냈습니다.
  • 인공지능의 한계: 이 새로운 시험지를 통해 최신 인공지능들을 시험해 보니, 여전히 모든 언어를 다 잘하는 AI 는 없었지만, 특정 언어에서는 놀라운 실력을 보여주기도 했습니다.

5. 왜 이것이 중요할까요?

이 연구는 "인공지능이 코딩을 배우고 발전하려면, 인간이 일일이 환경을 만들어줄 필요는 없다" 는 것을 증명했습니다.

  • 인간의 역할: 창의적인 문제 설계 (시험지 출제) 에만 집중하면 됩니다.
  • AI 의 역할: 반복적이고 지루한 환경 구축과 검증은 RepoLaunch 가 대신합니다.

🌟 한 줄 요약

"RepoLaunch 는 어떤 언어와 환경에서도 스스로 건물을 짓고 시험을 치르게 해주는 '만능 건축가'로, 인간은 문제만 내면 나머지는 AI 가 알아서 해결하게 만들어 코딩 교육과 개발의 미래를 바꿉니다."

이 도구를 통해 앞으로는 더 많은 인공지능이 더 다양한 코딩 문제를 풀며 성장할 수 있는 토양이 마련될 것입니다.