LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms

이 실증 연구는 LLM 기반 병합 충돌 해결 도구와 검색 기반 병합 충돌 해결 도구를 비교하여, LLM 은 불균형 콘텐츠 처리에 뛰어났으나 검색 기반 방법은 더 뛰어난 견고성과 일반화 능력을 제공하므로 궁극적으로 최적의 성능을 위해서는 두 패러다임을 결합한 하이브리드 시스템이 필요함을 밝혀냈다.

원저자: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

게시일 2026-05-19✓ Author reviewed
📖 4 분 읽기☕ 가벼운 읽기

원저자: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

당신과 친구가 동시에 같은 문서를 편집한다고 상상해 보세요. 두 사람 모두 같은 단락에 변경 사항을 적용하고 작업을 병합하려 할 때, 컴퓨터는 양손을 들어 올리며 "어떤 버전을 유지해야 할지 모르겠다!"라고 말합니다. 이를 **병합 충돌 (merge conflict)**이라고 합니다.

수십 년 동안 개발자들은 이러한 충돌을 수동으로 해결해 왔는데, 이는 지루하고 실수하기 쉬운 작업이었습니다. 최근 이 문제를 자동으로 해결하기 위해 두 가지 새로운 "스마트 도우미"가 등장했습니다. 이 논문은 두 도우미 중 어느 것이 더 나은지 비교하는 정면 대결입니다.

두 명의 경쟁자

두 도우미는 매우 다른 성격과 기술 세트를 가지고 있다고 생각하세요:

1. "수퍼 리더" (MergeGen 으로 대표되는 LLM 기반 접근법)

  • 작동 원리: 이 도우미는 수백만 권의 책과 코드 문서를 읽은 천재 학생과 같습니다. 이 도우미는 정답을 "계산"하지 않습니다. 대신, 사물이 보통 어떻게 보이는지에 대한 기억을 바탕으로 최선의 해결책을 추측합니다. 학습한 패턴을 바탕으로 다음 단어나 줄을 예측합니다.
  • 비유: 수천 가지 국물을 맛본 셰프와 같습니다. 재료가 빠진 레시피를 주면, 이 도우미는 향신료를 재는 것이 아니라 경험에 기반하여 국물이 어떻게 맛나야 하는지 "알고" 있어 적절한 양을 추가합니다.

2. "퍼즐 해결사" (SBCR 으로 대표되는 검색 기반 접근법)

  • 작동 원리: 이 도우미는 체계적인 엔지니어입니다. 이 도우미는 코드가 무엇을 의미하는지 알지 못하며, 단순히 텍스트 줄을 볼 뿐입니다. 이 도우미는 충돌을 거대한 퍼즐로 취급합니다. 기존 줄들의 수백만 가지 다른 조합을 시도하며, 각 조합이 원래 버전들과 얼마나 닮아 있는지 확인합니다. 이 도우미는 간단한 규칙을 사용합니다. "최선의 해결책은 보통 두 부모 버전과 어느 정도 닮은 혼합물이다."
  • 비유: 용의자가 누구인지 전혀 모르는 형사와 같습니다. 이 도우미는 사실과 완벽하게 일치하는 하나를 찾을 때까지 모든 가능한 범인 및 단서 조합을 시도합니다. 이 도우미는 추측하지 않고 테스트합니다.

레이스: 무슨 일이 일어났나요?

연구자들은 이 두 도우미를 오픈소스 프로젝트 (Java, C#, JavaScript 코드 등) 의 수천 가지 실제 충돌 사례에 대결시켰습니다. 그들이 발견한 내용은 다음과 같습니다:

1. "수퍼 리더"는 상황이 엉망일 때 이깁니다.
코드 두 버전의 크기가 매우 다를 때 (예: 한 버전은 거대한 단락을 추가하고 다른 버전은 단일 줄을 삭제한 경우), 수퍼 리더는 놀라웠습니다. 방대한 데이터를 학습했기 때문에 맥락을 이해하고 균형이 이상하더라도 올바른 줄을 선택할 수 있었습니다. 또한 훨씬 빨라 눈 깜짝할 사이에 충돌을 해결했습니다.

2. "퍼즐 해결사"는 상황이 균형 잡혔을 때 이깁니다.
두 버전의 크기와 구조가 유사할 때 퍼즐 해결사가 챔피언이었습니다. 수퍼 리더보다 줄들의 완벽한 혼합을 더 자주 찾았습니다. 또한 코드가 이상한 기호를 포함하거나, 비영어권 텍스트이거나, 매우 길 때 더 신뢰할 수 있었습니다.

3. "수퍼 리더"는 몇 가지 나쁜 버릇이 있습니다.

  • 메모리 누수: 때때로 수퍼 리더는 학습 과정에서 본 특정 예시에 "얽매여" 버립니다. 현재 상황에 맞지 않더라도 그 답을 반복합니다. 이를 **과적합 (overfitting)**이라고 합니다. 이 도우미는 교훈을 배우는 대신 시험 문제를 외운 것입니다.
  • 짧은 주의력: 코드 덩어리가 너무 크면 수퍼 리더는 압도되어 중간에 작동을 멈추고 충돌을 반만 해결한 채 둡니다.
  • 언어 장벽: 코드가 모델이 학습하지 않은 언어로 된 주석을 포함하면 혼란을 겪습니다.

4. "퍼즐 해결사"는 조금 느리지만 꾸준합니다.
많은 조합을 테스트해야 하므로 퍼즐을 푸는 데 시간이 더 걸립니다. 그러나 모든 것을 단순한 텍스트로 취급하기 때문에 긴 텍스트나 이상한 언어에 혼란을 겪지 않습니다. 아무것도 "기억"하지 않으므로 과적합되지 않습니다.

큰 결론: "은탄"은 없다

이 논문은 어떤 도우미도 단독으로는 완벽하지 않다고 결론 내립니다.

  • 작고 엉망인 충돌을 수퍼 리더에게 주면, 그것은 천재입니다.
  • 크고 균형 잡히거나 형식이 이상한 충돌을 퍼즐 해결사에게 주면, 그것은 신뢰할 수 있는 일꾼입니다.

해결책은 무엇일까요?
저자들은 충돌을 먼저 살펴보는 "교통 경찰" 역할을 하는 하이브리드 시스템을 구축할 것을 제안합니다.

  • 충돌이 작고 엉망이면, 교통 경찰은 그것을 수퍼 리더에게 보냅니다.
  • 충돌이 크고 균형 잡히거나 이상한 문자를 포함하면, 교통 경찰은 그것을 퍼즐 해결사에게 보냅니다.

올바른 도구가 올바른 일을 하도록 함으로써, 우리는 빠르고 정확한 시스템을 만들어 개발자들을 수동 병합의 두통에서 구할 수 있습니다.

한 문장으로 요약

이 논문은 AI 의 "추측자"는 빠르고 엉망인 문제에 뛰어나지만, "검색자"는 복잡하거나 이상한 문제에 더 신뢰할 수 있으며, 최선의 미래 도구는 둘의 스마트한 결합이 될 것이라고 증명합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →