Do Language Models Know Theo Has a Wife? Investigating the Proviso Problem

이 논문은 언어 모델이 조건문 내의 전제 투사 (proviso problem) 를 어떻게 처리하는지 진단용 데이터셋과 설명 가능성 분석을 통해 평가한 결과, 모델은 인간의 판단과 대체로 일치하지만 심층적인 의미나 화용론적 추론보다는 얕은 패턴 매칭에 의존한다는 점을 밝혔습니다.

Tara Azin, Daniel Dumitrescu, Diana Inkpen, Raj Singh

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 1. 연구의 배경: "테오의 아내" 수수께끼

연구자들은 다음과 같은 문장을 예로 들었습니다.

"테오가 시를 싫어한다면, 그의 아내도 싫어할 것이다."

이 문장을 들었을 때, 우리는 자연스럽게 **"테오에게는 아내가 있다"**는 사실을 전제로 받아들입니다. (아내가 없는데 '그의 아내'라고 할 수 없으니까요.)

하지만 언어학 이론 (형식 의미론) 에 따르면, 이 문장은 **"만약 테오가 시를 싫어한다면, (그때는) 테오에게 아내가 있다는 뜻이다"**라고 해석해야 합니다. 즉, 아내의 존재는 조건부 (If) 에 묶여 있어야 한다는 거죠.

그런데 실제 인간들은?
대부분의 인간은 "테오에게 아내가 있다"는 사실을 조건 없이 확실한 사실로 받아들입니다. (이걸 '전제 수용'이라고 합니다.)

질문: "그렇다면 AI 는 이걸 어떻게 해석할까? 이론대로 조건부로 생각할까, 아니면 인간처럼 무조건 사실로 받아들일까?"

🧪 2. 실험 방법: AI 를 위한 '미끼' 만들기

연구자들은 약 8,500 개의 문장을 만들어 AI 들 (RoBERTa, DeBERTa, LLaMA, Gemma 등) 을 시험에 들였습니다. 이 실험은 마치 AI 의 두뇌를 X-ray 로 찍는 것과 같습니다.

  • 시험지 (데이터): "만약 A 라면, B 의 (전제) 가 성립한다"는 형태의 문장들.
  • X-ray 촬영 (설명 가능성 분석): AI 가 정답을 고를 때, 어떤 단어에 집중했는지를 분석했습니다.
    • 예: "아내"라는 단어를 보고 "아, 아내가 있구나"라고 진짜로 이해했는지, 아니면 문장 구조상 "그의 ~"라는 패턴만 보고 기계적으로 답했는지 확인했습니다.

📊 3. 실험 결과: AI 는 '진짜 이해'가 아니라 '패턴 암기'를 했다

결과는 다소 충격적이었습니다.

① 인간과 똑같은 답을 냈지만, 이유는 달랐다.

AI 들은 인간과 거의 똑같은 정답 (테오에게 아내가 있다) 을 맞췄습니다. 하지만 그 이유는 이해가 아니라 패턴 매칭이었습니다.

  • 비유: 마치 요리사가 "소금"을 넣어야 맛있는 걸 알고 넣는 게 아니라, 레시피에 "소금"이라는 글자가 나오면 기계적으로 넣는 것과 같습니다.

② '미끼'를 바꿔주니 AI 는 당황했습니다.

연구자들은 문장의 핵심 단어 (전제 유발어) 를 뺏어 다른 단어로 바꿔주었습니다.

  • 원래: "테오가 를 싫어한다면, 그의 아내도..." (아내 = 시와 관련 없음)
  • 변형: "테오가 를 싫어한다면, 그의 친구도..." (친구 = 시와 관련 없음)

결과: AI 는 문장의 의미 (친구와 시의 관계) 를 전혀 고려하지 않고, 문장 구조상 "그의 ~"가 나오면 무조건 "친구가 있다"고 결론 내렸습니다. 의미는 무시하고 위치 (Position) 만 본 것입니다.

③ 훈련 데이터에 '속은' AI 들

일부 AI 는 훈련 과정에서 "조건부 문장 + '다시 (again)'라는 단어 = 부정 (아니다)"라는 잘못된 규칙을 외워버렸습니다. 그래서 문맥상 전혀 상관없는 단어가 들어와도, "아, '다시'가 나오니 부정해야지!"라고 엉뚱한 답을 내놓았습니다.

💡 4. 핵심 교훈: "정답을 맞췄다고 해서 이해한 건 아니다"

이 연구는 우리에게 중요한 메시지를 줍니다.

"AI 가 시험 점수 (정확도) 가 100 점이라도, 그건 진짜로 말을 이해해서 맞춘 게 아니라, 인간이 만든 패턴을 완벽하게 암기해서 맞춘 것일 뿐이다."

  • 비유: AI 는 완벽한 모방꾼입니다. 인간이 "비 올 때 우산 쓴다"고 하면, 비가 오지 않아도 우산을 들고 다니는 척할 수 있습니다. 하지만 비가 오지 않는 상황 (새로운 문맥) 이나, "비"라는 단어를 "눈"으로 바꿔주면 혼란에 빠집니다.

🚀 5. 결론: 앞으로의 방향

이 논문은 AI 가 **실제적인 언어 능력 (Pragmatic Competence)**을 갖추려면, 단순히 정답을 맞추는 것을 넘어 문맥과 의미를 진짜로 연결할 수 있어야 한다고 말합니다.

  • 요약: AI 는 지금 '말의 껍질'만 잘 까먹고 있습니다. '말의 속살 (의미)'을 이해하려면, 우리가 만든 새로운 진단 도구 (이 논문에서 개발한 데이터셋) 를 통해 더 꼼꼼하게 훈련시켜야 합니다.

이 연구는 AI 가 인간처럼 '말을 알아듣는' 단계로 가기 위해, 우리가 얼마나 더 치밀하게 검증해야 하는지 보여주는 중요한 이정표입니다.