Each language version is independently generated for its own context, not a direct translation.
🎬 영화 한 편으로 이해하기: "명탐정 vs. 천재 작가"
이 문제를 해결하기 위해 두 명의 캐릭터를 상상해 보세요.
전통적인 증명 프로그램 (CoqHammer):
- 성격: 아주 꼼꼼하고 논리적이지만, **계산 속도가 느리고 규칙만 따르는 '명탐정'**입니다.
- 약점: 복잡한 문제를 풀 때, 아주 작은 단계부터 하나하나 차근차근 추리해야 합니다. 때로는 "이런, 이걸 증명하려면 induction(수학적 귀납법) 이 필요한데 나는 그걸 못 해!"라고 포기해 버리기도 합니다.
- 장점: 보안이 완벽하고, 인터넷 없이도 내 컴퓨터에서 무료로, 빠르게 작동합니다.
대형 언어 모델 (LLM):
- 성격: 수만 권의 책을 읽은 천재 작가입니다.
- 약점: 아주 똑똑해서 "아, 이 문제는 이렇게 풀면 되겠네!" 하고 직관적으로 답을 말해줍니다. 하지만, 그 답을 증명하는 과정을 하나하나 논리적으로 보여주기엔 실수가 많고, 컴퓨터 리소스를 많이 먹으며, 기밀 정보가 유출될 위험이 있습니다.
🚀 이 연구의 핵심 아이디어: "명탐정에게 천재 작가의 '비법 노트'를 주자!"
기존에는 천재 작가 (LLM) 가 직접 문제를 풀게 하거나, 명탐정 (전통 프로그램) 이 혼자 끙끙 앓게 했습니다. 하지만 이 연구는 **"천재 작가의 머릿속에 있는 '직관적인 해법'을 추출해서, 명탐정이 사용할 수 있는 '비법 노트 (Lemma)'로 만들어주자"**고 제안합니다.
🛠️ Strat2Rocq(스트랫 -2- 로크) 의 작동 원리
이 시스템은 크게 두 단계로 나뉩니다.
1 단계: 오프라인 학습 (비법 노트 만들기)
- 천재 작가 (LLM) 에게 수천 개의 수학 문제를 보여줍니다.
- 작가가 "이 문제는 A, B, C 순서로 풀면 돼!"라고 자연어 (말) 로 설명하게 합니다.
- 연구진은 이 설명을 분석해서, "A+B=C 라는 공식을 쓰면 바로 해결된다!" 같은 **핵심 공식 (Lemma)**을 찾아냅니다.
- 이 공식들을 명탐정이 이해할 수 있는 **공식 언어 (Rocq)**로 번역하여 '비법 노트'에 적어둡니다.
- 비유: 천재 작가가 "이 문제는 '삼각형의 내각의 합은 180 도'라는 법칙만 알면 1 초 만에 풀린다"고 말하면, 우리는 그 법칙을 명탐정에게 주는 '비법 카드'로 만듭니다.
2 단계: 온라인 증명 (실전 적용)
- 이제 새로운 문제가 생겼을 때, **명탐정 (CoqHammer)**만 사용합니다. (천재 작가는 필요 없습니다!)
- 명탐정은 문제 풀이를 시작하기 전에, 우리가 미리 만들어둔 **'비법 노트'**를 펼쳐봅니다.
- "아! 이 문제는 'power_1'이라는 공식을 쓰면 바로 해결되네!"라고 생각하며, 복잡한 추리 없이 순식간에 문제를 해결합니다.
📊 결과는 어땠나요?
- 성공률 상승: 명탐정 (CoqHammer) 이 혼자 풀 때보다 약 13.4% 더 많은 문제를 성공적으로 풀었습니다.
- 보안과 비용: 천재 작가 (LLM) 를 실시간으로 부르지 않아도 되므로, 비용이 절감되고 보안 위험도 사라집니다.
- 부수적 효과: 이 '비법 노트'를 다시 천재 작가에게 주면, 작가의 실력도 4% 정도 더 좋아졌습니다. 서로의 장점을 공유한 셈입니다.
💡 왜 이것이 중요한가요?
지금까지 "AI 가 모든 걸 다 할 거야"라고 생각했지만, 이 연구는 **"AI 의 지혜를 뽑아내어, 우리가 믿고 쓸 수 있는 전통적인 도구 (보안, 비용 효율성) 를 더 강력하게 만들 수 있다"**는 것을 보여줍니다.
마치 천재 요리사 (LLM) 가 알려준 '비밀 레시피'를 받아, 일반 주방장 (전통 프로그램) 이도 고급 요리를 완벽하게 만들어내는 상황과 같습니다.
📝 한 줄 요약
"AI 의 직관적인 해법을 '공식'으로 변환해 전통적인 증명 프로그램에게 주면, 보안과 비용을 지키면서도 훨씬 더 똑똑하게 문제를 풀 수 있다!"