Discovering New Theorems via LLMs with In-Context Proof Learning in Lean

본 논문은 Lean 4 에서 형식적으로 검증된 정리와 증명들을 반복적으로 대규모 언어 모델에 피드백함으로써 새로운 증명하기 어려운 수학적 추측의 발견률과 성공을 획기적으로 향상시키는 컨텍스트 학습을 활용하는 추측-증명 루프 (CPL) 라는 파이프라인을 소개한다.

원저자: Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

게시일 2026-05-07
📖 3 분 읽기☕ 가벼운 읽기

원저자: Kazumi Kasaura, Naoto Onda, Yuta Oriike, Masaya Taniguchi, Akiyoshi Sannai, Sho Sonoda

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

매우 똑똑하지만 약간 건망증이 있는 로봇에게 복잡한 수학 퍼즐을 푸는 법을 가르치려 한다고 상상해 보세요. 그 로봇은 대규모 언어 모델 (LLM) 이며, 퍼즐은 Lean이라는 엄격한 컴퓨터 언어로 작성된 형식 수학 증명들입니다.

이 논문은 이 로봇을 가르치는 새로운 방법을 소개하는데, 이를 **가설 설정 - 증명 루프 (Conjecturing-Proving Loop, CPL)**라고 부릅니다. 간단한 비유를 통해 그 작동 원리를 설명해 보겠습니다.

문제: "추측하고 확인하기" 함정

보통 사람들이 AI 에게 수학을 시킬 때, 퍼즐을 추측하고 한 번에 해결하도록 요청합니다.

  • 비유: 학생에게 "수학 문제를 만들고 즉시 풀어라"고 요청한다고 상상해 보세요.
  • 문제점: 학생은 게을러집니다. 해결하기 쉬운 문제 (예: "2 + 2 = 4") 를 작성합니다. 왜냐하면 그 문제들이 풀기 쉽기 때문입니다. 그들은 실패할 수 있다는 것을 알기 때문에 어려운 문제를 피합니다. 그 결과 AI 는 수천 개의 쉽고 지루한 증명들을 생성하게 되며, 어렵고 흥미로운 것들은 놓치게 됩니다.

해결책: "이 단계 춤" (CPL)

저자들은 이 과정을 **가설 설정자 (아이디어 생성자)**와 **증명자 (해결사)**라는 두 가지 명확한 역할로 나눕니다.

  1. 가설 설정자 (건축가): AI 의 이 부분은 기존 수학 규칙들의 도서관을 살펴보고 새로운 아이디어 (가설) 를 생각해 냅니다. 아직 이를 해결하려고 시도하지는 않습니다. 단지 적어 두기만 합니다.
  2. 증명자 (건설가): 이 부분은 아이디어를 받아들이고 이를 위한 증명을 구축하려고 시도합니다. 실패하면 다시 시도합니다. 성공하거나 시도 횟수가 소진될 때까지 계속 시도합니다.
  3. 도서관 (기억): 증명자가 성공적으로 증명을 구축할 때마다, 그 증명은 도서관에 추가됩니다.

마법의 재료: 인-컨텍스트 학습 (In-Context Learning)
여기가 교묘한 부분입니다. 증명자는 원래 수학 규칙들만 보는 것이 아닙니다. 그것은 현재 세션 동안 이미 성공적으로 구축한 증명들의 도서관을 봅니다.

  • 비유: 학생이 시험을 치른다고 상상해 보세요. 옛날 방식에서는 시험 시작 전에 암기한 것만 의존해야 했습니다. 하지만 이 새로운 방식에서는 학생이 문제를 올바르게 풀 때마다, 다음 문제를 tackling 하기 전에 자신의 해답을 읽을 수 있습니다. 그들은 자신의 최근 성공들로부터 "요령"과 "전략"을 배웁니다.

그들이 발견한 것

연구자들은 AI 가 아직 잘 알지 못하는 몇 가지 까다로운 위상수학 개념 (형태와 공간을 다루는 수학의 한 분야) 에 대해 이를 테스트했습니다.

  • 양 vs 질: 옛날 방식 (한 번에 추측하고 해결하기) 은 더 많은 전체 정리들을 생성했지만, 대부분은 짧고 쉬웠습니다. 새로운 방식 (CPL) 은 더 적은 전체 정리들을 생성했지만, 훨씬 더 어렵고 길었습니다.
  • 큰 승리: 새로운 방식은 "알파-열린 집합 (alpha-open sets)"에 관한 구체적이고 어려운 정리를 성공적으로 발견했는데, 옛날 방식은 20 번 시도한 후에도 단 한 번도 찾지 못했습니다.
  • 성공으로부터의 학습: AI 에게 자신의 이전 증명들 도서관을 "요약지 (cheat sheet)" (컨텍스트) 로 제공했을 때, 그 컨텍스트 없이는 풀 수 없었던 어려운 정리들을 증명할 수 있었습니다. AI 가 평범한 영어로 정리를 증명하지 못했더라도, 유사한 성공적인 증명들을 본 후에는 Lean 코드로는 증명할 수 있었습니다.

결론

이 논문은 "아이디어 생성"과 "증명 해결"을 분리하고, AI 가 실시간으로 자신의 검증된 성공들로부터 학습하도록 함으로써, 그렇지 않으면 놓쳤을 더 어렵고 복잡한 수학 진리들을 발견하게 할 수 있다고 주장합니다. 마치 AI 에게 최종 시험을 치르기 전에 자신의 숙제를 공부하게 하여 출발선을 앞당겨 주는 것과 같습니다.

참고: 이 논문은 형식 수학 밖의 다른 실생활 응용 (의료 진단, 금융 예측 등) 에 대해 이 방법이 작동한다고 주장하지 않으며, 오직 수학 정리 생성 및 검증에 대한 이 방법에만 엄격하게 초점을 맞춥니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →