Semantic Reverse Engineering Legacy Software Applications with ChatGPT, Gemini AI, and Claude AI

본 연구 논문은 ChatGPT, Gemini, Claude AI 를 활용하여 레거시 데이터베이스 소프트웨어 애플리케이션을 의미론적으로 역공학하는 방법에 관한 결과를 제시합니다.

원저자: Christian Mancas, Diana Christina Mancas

게시일 2026-05-07
📖 4 분 읽기☕ 가벼운 읽기

원저자: Christian Mancas, Diana Christina Mancas

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

상상해 보세요. 더 이상 아무도 사용하지 않는 언어로 쓰인 낡고 먼지 쌓인 책들로 가득 찬 도서관이 있다고 말입니다. 사전도 없고, 저자들은 이미 오래전에 세상을 떠났습니다. 당신의 목표는 단순히 페이지에 적힌 글자를 복사하는 것이 아닙니다 (그건 쉽습니다). 당신의 목표는 저자가 따르려 했던 이야기논리, 그리고 규칙을 이해하는 것입니다.

이 논문은 ChatGPT, Gemini, Claude라는 세 가지 다른 "초지능 로봇"을 이용해 오래된 컴퓨터 프로그램을 읽고, 그 프로그램이 실제로 무엇을 하는지 설명하려는 연구팀에 관한 것입니다.

다음은 간단한 비유를 통해 그들의 실험을 요약한 것입니다:

미션: 기계 속의 "유령" 해독하기

연구자들은 클럽의 문지기처럼 행동하는 오래된 소프트웨어 (레거시 코드) 를 가지고 있었습니다. 이 문지기는 다음과 같은 특정 규칙을 가지고 있었습니다:

  1. 지리 규칙: "어떤 도시가 국가의 수도라면, 그 도시는 반드시 그 국가에 속해야 한다."
  2. 왕실 규칙: "두 명의 왕이 결혼했거나 부모/자식 관계가 아닌 한, 동시에 같은 국가를 통치할 수 없다."

문제점은 무엇일까요? 코드는 VBA 라는 오래된 스타일로 작성되어 있었으며, 왜 그렇게 작성되었는지 설명하는 주석은 전혀 없었습니다. 연구자들은 AI 가 코드를 보고 "아, 알겠다! 이 코드는 수도가 국가와 일치해야 한다는 규칙을 강제하고 있구나"라고 말할 수 있는지 확인하고 싶었습니다.

세 명의 로봇 (AI 도구들)

연구자들은 세 가지 다른 AI "탐정"을 테스트했습니다:

1. ChatGPT: 사려 깊은 튜터

  • 작동 방식: ChatGPT 는 정말로 올바르게 이해하고 싶어 하는 똑똑한 학생과 같았습니다. 연구자들이 첫 번째 간단한 규칙을 주었을 때, ChatGPT 는 완벽하게 이해했습니다.
  • 실수: 그들이 복잡한 "왕실 규칙"을 주었을 때, ChatGPT 는 처음에 이야기를 잘못 이해했습니다. 코드가 결혼을 거부하는 것이라고 생각했지만, 실제로는 코드가 기존 결혼 관계의 변경을 거부하는 것이었습니다.
  • 회복: 연구자들이 정정해 주었을 때, ChatGPT 는 단순히 "알겠습니다"라고 말하지 않았습니다. "아! 내가 실수했구나. 나는 논리의 잘못된 부분을 보고 있었어. 당신이 옳아. 결혼 상태에 관한 것이 아니라 배우자를 바꾸는 전환에 관한 거야"라고 말하며 자신의 실수를 인정하고, 왜 틀렸는지 설명했습니다. 정정을 통해 배웠습니다.
  • 판단: 깊은 의미를 이해하고 실수를 인정하는 데 가장 뛰어났습니다.

2. Claude: 우아한 시인

  • 작동 방식: Claude 는 매우 정중했으며 코드의 수학적 아름다움을 감상했습니다. 간단한 규칙을 즉시 이해했고, 연구자들의 영리한 논리를 칭찬했습니다.
  • 실수: ChatGPT 와 마찬가지로 복잡한 "왕실 규칙"을 처음에 잘못 이해했습니다. "결혼한 부부에게는 동시 통치가 불가능하다"라는 혼란스러운 주장을 했는데, 이는 말이 되지 않았습니다.
  • 회복: 정정을 받으면 실수를 인정하고 마침내 논리를 이해했습니다. 그러나 대화하는 속도가 매우 느렸습니다 (연구자들은 질문 사이에 몇 시간을 기다려야 했습니다). 이 과정은 매우 느리고 격식 있는 차 한 잔의 파티처럼 느껴졌습니다.
  • 판단: 이해력은 매우 좋았지만, 느리고 다소 경직되었습니다.

3. Gemini: 지나치게 열성적인 예술가

  • 작동 방식: Gemini 는 가장 극적이었습니다. "이 코드는 도시가 국가에 속하는지 확인한다"라고 말하는 대신, "이것은 윤리적 파열을 감지하는 바이오-논리 자기 치유 센서입니다!"라고 말했습니다. 박테리아, 석회암, 미로 등 지나치게 많은 비유를 사용했으며, 오래된 코드를 분석하는 대신 연구자들에게 다른 현대적 도구를 사용하도록 설득하려 했습니다.
  • 실수: 간단한 수학도 틀렸습니다 (단사 함수를 전사 함수라고 부름). 정정을 받으면 이해한 척했지만 같은 실수를 계속 반복했습니다.
  • 판단: 지나치게 수식어투가 많고 장황했습니다. 자신의 비유에 빠져 사실에 집중하지 못했습니다.

대발견: "상태" 대 "변화"

이 논문에서 가장 중요한 교훈은 미묘하지만 거대한 논리적 차이입니다:

  • 상태: 현재 상황이 유효한가? (예: "이 결혼은 합법적인가?")
  • 전환: 상황을 바꾸는 행위가 유효한가? (예: "남편을 다른 사람으로 바꿀 수 있는가?")

연구자들은 AI 도구들이 "상태" (간단한 규칙) 를 파악하는 데는 훌륭하다는 것을 발견했습니다. 하지만 복잡한 "전환" 규칙 (왕실 규칙) 에 이르러서는 모두 혼란스러워했습니다. 코드가 결혼 자체를 막는다고 생각했지만, 실제로는 결혼의 변경을 막는 것이었습니다.

최종 결론

연구자들은 다음과 같이 결론 내렸습니다:

  1. AI 는 작은 퍼즐을 위한 훌륭한 조수입니다: AI 에게 작은 코드 조각을 주면 매우 잘 설명할 수 있습니다.
  2. AI 는 아직 전문가를 대체할 수 없습니다: 코드가 조금 더 크거나 복잡하면, AI 는 코드가 실제로 하는 일과 정반대되는 것을 자신 있게 설명할 수 있습니다.
  3. 수학이 중요합니다: 연구자들은 AI 도구가 인간이 수학적 지식 (집합론과 논리 등) 을 알고 있을 때 가장 잘 작동한다고 지적했습니다. AI 는 올바른 방향으로 이끌기 위해 "논리"를 말하는 인간이 필요합니다.

요약하자면: 이러한 AI 도구들은 매우 영리한 인턴과 같습니다. 매뉴얼을 읽고 기본 사항을 완벽하게 설명할 수 있지만, 까다로운 현실 세계의 시나리오를 주면 자신 있게 잘못된 이야기를 할 수 있습니다. 여전히 그들의 작업을 이중으로 확인해 줄 숙련된 인간 엔지니어가 필요합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →