Large Language Models are Contrastive Reasoners

이 논문은 정답과 오답을 모두 생성하도록 유도하는 '대조적 프롬프팅 (Contrastive Prompting)' 기법이 별도의 예시 없이도 LLM 의 추론 능력을 획기적으로 향상시켜 기존 최첨단 방법들을 능가함을 보여줍니다.

Liang Yao

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

"거울을 보는 AI": 대조적 추론 (Contrastive Prompting) 이란 무엇일까요?

이 논문은 인공지능 (LLM) 이 더 똑똑하게 생각하게 만드는 아주 간단하지만 혁신적인 방법을 소개합니다. 바로 **"정답과 오답을 동시에 만들어보게 하는 것"**입니다.

이 방법을 쉽게 이해할 수 있도록 일상생활에 비유해 설명해 드릴게요.


1. 기존 방식의 문제점: "혼자서 고민하는 학생"

기존에 AI 에게 문제를 풀게 할 때는 보통 **"단계별로 생각해보자 (Let's think step by step)"**라고 말해줬습니다.

  • 비유: 시험을 치는 학생이 혼자서 문제를 풀고 있습니다. "자, 하나씩 차근차근 풀어보자!"라고 스스로 독려하지만, 실수할 가능성이 여전히 높습니다. 특히 수학 문제나 상식 문제에서 한 번 실수하면 그 실수가 그대로 정답으로 제출되어 틀리게 됩니다.

2. 새로운 방법 (이 논문의 핵심): "스승과 제자, 혹은 변호사와 검사"

이 논문은 AI 에게 **"자, 이제 정답 하나와 틀린 답 하나를 동시에 만들어봐!"**라고 지시합니다. 이를 **대조적 추론 (Contrastive Prompting)**이라고 부릅니다.

  • 비유 1: 거울을 보는 것
    AI 가 문제를 풀 때, 마치 거울을 보는 것처럼 자신의 생각을 두 가지 버전으로 나눕니다.

    • 버전 A (정답): "나는 이렇게 계산했어. 5 곱하기 6 은 30 이고, 10 년이면 300 이야."
    • 버전 B (오답): "아, 잠깐. 10 년을 20 년으로 착각했네? 그럼 600 이 되겠지. (하지만 이건 틀렸어! 10 년은 10 년이니까.)"

    AI 는 이 두 가지를 비교하면서 **"아! 내가 여기서 실수할 수 있구나. 오답을 만들어보니 왜 틀린지 알겠다"**라고 스스로 깨닫게 됩니다. 마치 거울을 통해 자신의 실수를 바로잡는 것과 같습니다.

  • 비유 2: 변호사와 검사의 토론
    AI 는 스스로 두 명의 인격을 연기합니다.

    • 변호사: "이게 정답입니다!"라고 논리적으로 설명합니다.
    • 검사: "아니, 그건 오해의 소지가 있습니다. 만약 이렇게 생각하면 틀리게 됩니다!"라고 반박합니다.

    이 두 목소리가 싸우는 과정에서 AI 는 가장 논리적이고 확실한 결론 (정답) 에 도달하게 됩니다.

3. 왜 이렇게 하면 더 잘 풀까요?

이 방법은 AI 가 가진 방대한 지식 (인터넷의 수많은 글, 책, 토론 등) 을 활용하는 방식입니다.

  • 인터넷의 경험: 인터넷에는 "정답"과 "틀린 답"이 섞여 있습니다. AI 는 이걸 학습하면서 "어떤 답이 맞고 어떤 답이 틀린지"를 이미 알고 있습니다.
  • 실수로부터 배우기: 인간도 실수를 통해 더 많이 배웁니다. AI 도 "틀린 답"을 직접 만들어보면서, "아, 내가 여기서 함정에 빠질 수 있구나"라고 스스로 경계하게 됩니다.
  • 확신 증가: AI 가 정답을 말할 때, "틀린 답"을 먼저 만들어보면서 그 오답이 왜 틀린지 확인했기 때문에, 정답을 말할 때 훨씬 더 확신 있게 (높은 확률로) 답을 내놓습니다.

4. 실제 효과는 어떨까요?

논문에서는 이 방법을 적용했을 때 놀라운 결과를 보였습니다.

  • 수학 문제 (GSM8K): 기존에 35.9% 만 맞췄던 AI 가, 이 방법을 쓰니 **88.8%**까지 정답률이 뛴 것입니다. (GPT-4 기준)
  • 상식 문제: "왜 이 상황이 일어날까?" 같은 복잡한 상식 문제에서도 훨씬 더 똑똑하게 답변했습니다.
  • 간단함: 별도의 복잡한 학습이나 사람이 직접 예시를 만들어줄 필요가 없습니다. 그냥 **"정답과 오답을 하나씩 줘봐"**라고 말하면 됩니다.

5. 요약: 한 줄로 정리하면?

"AI 에게 "정답만 말해"라고 하기보다, "정답과 틀린 답을 비교해보면서 스스로 실수를 고쳐봐"라고 시키면, AI 는 훨씬 더 똑똑하고 정확하게 문제를 푼다."

이 방법은 마치 우리가 시험을 볼 때, "이게 왜 틀렸지?"라고 오답 노트를 작성하며 공부하는 것과 같은 원리입니다. AI 도 이제 스스로의 실수를 분석하고 교정하는 능력을 가진 '대조적 추론가'가 된 것입니다.