Learning to Disprove: Formal Counterexample Generation with Large Language Models

이 논문은 Lean 4 에서 자동으로 검증 가능한 형식적 반례 생성을 목표로, 심볼릭 변이 전략과 다중 보상 전문가 반복 학습 프레임워크를 통해 대형 언어 모델을 미세 조정하여 수학 추론의 증명과 반례 발견 능력을 모두 향상시키는 방법을 제시합니다.

Zenan Li, Zhaoyu Li, Kaiyu Yang, Xiaoxing Ma, Zhendong Su

게시일 2026-03-23
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"수학에서 '틀린 것'을 찾아내는 법을 AI 에게 가르치는 연구"**입니다.

기존의 AI 수학 연구는 대부분 "정답을 증명하는 것 (Proof)"에 집중했습니다. 마치 시험에서 "왜 이 답이 맞는지"를 설명하는 데만 열중했던 셈이죠. 하지만 수학에서 **'반례 (Counterexample)'**를 찾는 것, 즉 "이 명제는 틀렸습니다! 여기 틀린 예시가 있습니다!"라고 지적하는 능력은 그 못지않게 중요합니다.

이 논문은 AI 가 반례를 찾아내고, 그 반례가 진짜로 틀린 이유를 형식적인 언어 (Lean 4) 로 엄밀하게 증명하는 능력을 키우는 방법을 제안합니다.

핵심 내용을 일상적인 비유로 설명해 드릴게요.


1. 문제: AI 는 '맞는 것'은 잘 찾지만, '틀린 것'은 못 찾는다

지금까지의 수학 AI 는 마치 **"올바른 길만 찾아주는 내비게이션"**처럼 작동했습니다. 하지만 수학은 때로 "이 길은 가짜입니다!"라고 말해주는 **'가짜 길 탐지기'**가 필요합니다.

  • 기존의 한계: 반례를 찾는 데이터가 너무 적고, AI 가 틀린 답을 내놓았을 때 "틀렸어"라고만 알려주는 신호 (보상) 가 너무 희박해서 AI 가 배우기 힘들었습니다.

2. 해결책 1: "가짜 문제"를 대량으로 만들어내는 마법 (Symbolic Mutation)

연구진은 AI 에게 반례를 가르칠 데이터를 직접 만들어냈습니다. 어떻게요? 수학의 '조작'을 이용했습니다.

  • 비유: 레시피 변조하기
    • 원래 완벽한 요리 레시피 (정리, Theorem) 가 있다고 가정해 보세요. "소금 (가설 1) 과 설탕 (가설 2) 을 넣으면 맛있는 국 (결론) 이 나온다"는 명제입니다.
    • 연구진은 AI 에게 **"소금을 빼고 설탕만 넣으면 어떨까?"**라고 물어봤습니다.
    • 당연히 국이 맛이 없겠죠? (이게 바로 반례가 됩니다).
    • AI 는 원래 레시피에서 필요한 재료 (가설) 하나를 뺀 뒤, "아! 그럼 이 국은 맛이 없네!"라고 증명하는 연습을 합니다.
    • 이 과정을 통해 연구진은 57 만 개 이상의 '가짜 문제' 데이터를 만들어냈습니다. AI 가 반례를 찾는 훈련을 할 수 있는 거대한 운동장이 생긴 셈입니다.

3. 해결책 2: 두 번의 칭찬으로 학습시키는 '다중 보상 시스템' (Multi-Reward)

기존에는 AI 가 반례를 찾으면 "정답!"이라고 한 번만 칭찬했습니다. 하지만 반례 찾기는 어렵기 때문에, AI 가 실패하면 아무런 피드백도 못 받아서 학습이 멈췄습니다.

  • 비유: 요리 대회 심사
    • 기존 방식: 요리사가 "소금 없이 국을 끓였는데 맛이 없다"고 증명하면 점수를 줍니다. 하지만 실패하면 0 점.
    • 새로운 방식 (이 논문의 방법):
      1. 첫 번째 점수: "소금 없이 국을 끓였을 때, 국이 맛이 없는지 (반례가 맞는지) 증명했니?"
      2. 두 번째 점수: "그리고 '소금이 꼭 필요하다'는 사실도 증명했니?"
    • AI 가 첫 번째 과제는 어렵지만, 두 번째 과제 (소금의 필요성 증명) 는 상대적으로 쉽습니다. AI 가 두 번째 과제를 성공하면 부분 점수를 줍니다.
    • 이렇게 작은 성공이라도 점수로 보상해주니, AI 는 포기하지 않고 계속 시도하며 더 잘하게 됩니다.

4. 결과: AI 가 "틀린 것"을 찾아내는 실력이 비약적으로 상승

이 방법으로 훈련된 AI 는 기존 최고의 수학 AI 들보다 훨씬 뛰어났습니다.

  • 성과: 새로운 테스트에서 기존 AI 들보다 47%~74% 더 많은 반례를 찾아냈습니다.
  • 의미: 이제 AI 는 단순히 "이게 맞다"고 말만 하는 게 아니라, **"이건 틀려요! 왜 틀린지 증명해 드릴게요"**라고 능동적으로 지적할 수 있게 되었습니다.

5. 결론: AI 의 '자기 성찰' 능력 향상

이 연구의 가장 큰 의의는 AI 가 **자신의 추론 과정을 스스로 검증 (Self-verification)**할 수 있게 되었다는 점입니다.

  • 마치 학생이 시험 문제를 풀 때, "내 답이 맞을까? 아니면 반례가 있을까?"라고 스스로 의심하고 확인하는 능력을 키운 것과 같습니다.
  • 이는 AI 가 단순히 계산을 잘하는 것을 넘어, 수학적 논리와 비판적 사고를 갖추는 중요한 첫걸음입니다.

한 줄 요약:

"이 논문은 AI 에게 '정답 찾기'뿐만 아니라 **'오답 찾기 (반례 생성)'**도 가르쳤으며, 이를 위해 가짜 문제를 대량으로 만들고, 작은 성공에도 점수를 주는 새로운 학습 방식을 개발하여 AI 의 수학 실력을 획기적으로 높였습니다."