Can LLM Aid in Solving Constraints with Inductive Definitions?

이 논문은 대규모 언어 모델 (LLM) 이 유도적 정의와 관련된 제약 조건을 해결하는 데 필요한 보조 명제를 생성하고, 이를 제약 해결기와 결합한 신경-심볼릭 접근법을 통해 기존 솔버의 성능을 약 25% 향상시켰음을 보여줍니다.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu

게시일 Mon, 09 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"컴퓨터가 스스로 복잡한 수학적 논리를 증명할 때, AI(대형 언어 모델) 가 어떻게 도와줄 수 있을까?"**라는 질문에 답하는 연구입니다.

쉽게 말해, **"컴퓨터가 혼자서 미로 (복잡한 논리 문제) 를 빠져나오지 못할 때, AI 가 '지도'를 그려주어 길을 찾아주는 시스템"**을 개발했다는 이야기입니다.

아래에 이 논문의 핵심 내용을 일상적인 비유로 설명해 드립니다.


🧩 1. 문제 상황: 컴퓨터가 헤매는 '유도'의 미로

이 논문에서 다루는 '귀납적 정의 (Inductive Definitions)'는 마치 레고 블록이나 도미노와 같습니다.

  • 기본 규칙: "도미노 1 번이 넘어지면 2 번이 넘어진다" (기본 사례).
  • 연속성: "n 번이 넘어지면 n+1 번도 넘어진다" (귀납 단계).

이런 규칙을 이용해 "도미노 100 번이 넘어질까?"를 증명하려면, 컴퓨터는 1 번부터 100 번까지 하나하나 확인해야 하거나, 논리적으로 모든 경우를 증명해야 합니다.

**기존의 컴퓨터 프로그램 (SMT 솔버 등)**은 아주 똑똑하지만, 새로운 규칙이나 복잡한 연결고리가 필요할 때는 길을 잃어버립니다. 마치 미로에서 벽만 보고 앞을 못 보는 상태입니다. 이때는 인간이 "여기서 이 규칙을 적용하면 돼!"라고 **보조 규칙 (보조 명제, Lemma)**을 알려줘야 증명할 수 있습니다. 하지만 이 보조 규칙을 찾아내는 건 인간에게도 매우 어렵습니다.

🤖 2. 해결책: AI(로봇) 와 논리 전문가 (컴퓨터) 의 팀워크

저자들은 **LLM(대형 언어 모델, 예: 챗봇)**과 논리 증명 프로그램을 짝꿍으로 만들었습니다. 이를 '뉴로-심볼릭 (Neuro-symbolic)' 접근법이라고 합니다.

  • LLM (창의적인 아이디어맨): "이런 식으로 생각해보면 어떨까?"라고 다양한 추측 (가설) 을 쏟아냅니다.
  • 논리 프로그램 (엄격한 심사관): AI 가 낸 아이디어가 진짜로 맞는지, 쓸모있는지 빠르게 검증합니다.

이 두 명은 3 단계 프로세스로 협력합니다.

① 단계: 질문하기 (Query) - "지도 그려줘!"

AI 에게 "이 문제를 풀기 위해 어떤 보조 규칙이 필요할까?"라고 묻습니다. 이때 단순히 "답을 줘"라고 하면 AI 가 엉뚱한 소리를 할 수 있으므로, 두 가지 특별한 전략을 사용합니다.

  • 전략 1 (단계별 추론): "일단 기본 규칙을 적용해 보고, 여기서 막히면 어떤 새로운 규칙이 필요할지 생각해보자"라고 인간처럼 단계별로 생각하게 유도합니다.
  • 전략 2 (비유와 일반화): "이 복잡한 식을 단순화하면 어떤 공통점이 보이니? 그 공통점을 이용해 새로운 규칙을 만들어보자"라고 유도합니다.

② 단계: 필터링 (Filter) - "쓰레기 제거"

AI 가 만든 아이디어 중에는 틀린 것이나 쓸모없는 것이 섞여 있습니다.

  • 틀린 것: "0 을 더하면 0 이 된다" (실제로는 원래 수와 같아야 함) 같은 명백한 오류.
  • 쓸모없는 것: 증명하려는 결론을 그대로 반복하거나, 전혀 관련 없는 이야기.
    이 단계에서 논리 프로그램이 1 초 만에 "이건 틀렸어"라고 걸러냅니다.

③ 단계: 검증 (Validate) - "진짜 증명해보기"

남은 아이디어가 정말로 문제를 해결하는 데 도움이 되는지, 그리고 그 아이디어 자체가 증명 가능한지 다시 확인합니다. 만약 아이디어가 너무 어렵다면, 그 아이디어를 풀기 위해 새로운 미로를 만들고 다시 AI 에게 질문합니다 (재귀적 과정).

🏆 3. 실험 결과: 기존 프로그램보다 25% 더 잘 풀었다!

연구팀은 700 개 이상의 복잡한 논리 문제 (미로) 를 가지고 실험했습니다.

  • 기존 프로그램 (cvc5, Vampire 등): 혼자서 약 300~400 개 정도만 해결했습니다.
  • 새로운 시스템 (LLM4Ind): AI 의 도움을 받아 약 525 개를 해결했습니다.
  • 결과: 기존 프로그램보다 약 25% 더 많은 문제를 성공적으로 풀었습니다.

또한, AI 가 엉뚱한 답을 내놓더라도 논리 프로그램이 빠르게 걸러주기 때문에, AI 의 '환각 (Hallucination, 거짓말)' 현상에도 강하게 대처할 수 있었습니다.

💡 4. 핵심 교훈: "창의성"과 "엄격함"의 결혼

이 연구의 가장 큰 메시지는 AI 만 믿거나, 기존 컴퓨터 프로그램만 믿지 말고, 둘을 섞어라는 것입니다.

  • AI 는 창의적이지만 때로는 헛소리를 합니다.
  • 컴퓨터 프로그램은 정확하지만 새로운 아이디어를 찾아내는 데는 약합니다.

이 두 가지가 만나면, AI 가 새로운 길 (보조 규칙) 을 제안하고, 컴퓨터가 그 길이 진짜로 통하는지 확인하는 완벽한 팀워크가 만들어집니다. 이는 앞으로 소프트웨어의 버그를 찾거나, 복잡한 수학 문제를 풀 때 큰 도움이 될 것입니다.


한 줄 요약:

"복잡한 논리 미로에서 길을 잃은 컴퓨터에게, AI 가 창의적으로 '지도'를 그려주고, 컴퓨터가 그 지도가 진짜인지 검증하며 함께 미로를 빠져나가는 새로운 시스템을 만들었습니다."