ITLC at SemEval-2026 Task 11: Normalization and Deterministic Parsing for Formal Reasoning in LLMs

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"거대 인공지능 (LLM) 이 논리 문제를 풀 때, 내용이 마음에 들면 '아, 맞네!'라고 착각하고 틀린 답을 내놓는 현상"**을 해결한 연구입니다.

이 문제를 **'내용의 함정 (Content Effect)'**이라고 부르는데, 이 팀은 이를 해결하기 위해 "논리 구조만 남기고 내용은 모두 지우는" 아주 똑똑한 방법을 개발했습니다.

이 연구를 쉽게 이해할 수 있도록 세 가지 비유로 설명해 드릴게요.

1. 문제 상황: "맛있는 음식에 속는 AI"

상상해 보세요. AI 가 논리 퀴즈를 풀고 있습니다.

질문: "모든 고양이는 동물이다. 어떤 동물은 날 수 있다. 따라서 모든 고양이는 날 수 있다."
AI 의 반응: "음... 고양이는 동물이고, 동물 중에는 박쥐처럼 날 수 있는 것도 있네. 그래서 고양이가 날 수 있다고? 아마 그럴 거야!"

AI 는 논리적으로 '틀린' 결론을 내렸지만, 세상에서 고양이가 날 수 있다는 사실이 '그럴듯해 (Plausible)' 보이니까 논리 규칙을 무시하고 맞다고 판단해 버립니다. 이것이 바로 이 논문이 지적하는 **'내용의 함정'**입니다. AI 가 논리 (형식) 보다는 내용 (상식) 에 너무 의존하는 것입니다.

2. 해결책: "논리 구조만 남기는 '탈의실'"

이 팀이 개발한 방법은 AI 가 문제를 풀기 전에, 문제의 '옷'을 벗겨내는 과정입니다.

비유: 논리 문제를 복잡한 의상을 입은 사람이라고 생각하세요.
- "고양이", "날다", "동물" 같은 단어들은 옷입니다.
- "모든 ~ 는 ~ 이다", "어떤 ~ 는 ~ 이 아니다" 같은 문장 구조는 **사람의 뼈대 (논리 구조)**입니다.

이 팀의 방법은 다음과 같습니다:

옷 벗기기 (Normalization): AI 가 문제를 읽을 때, '고양이', '날다' 같은 구체적인 단어 (옷) 를 모두 지우고 A, B, C 같은 기호로만 바꿉니다.
- 원문: "모든 고양이는 동물이다."
- 변환 후: "모든 A 는 B 이다."
뼈대 확인 (Deterministic Parsing): 이제 AI 는 내용을 볼 수 없으니, 오직 **뼈대 (A, B, C 의 관계)**만 보고 "이 구조가 논리 법칙에 맞는지" 기계처럼 딱딱하게 판단합니다.
- "모든 A 는 B 이고, 어떤 B 는 C 라면, 모든 A 는 C 인가?" -> 아니오. (이건 논리 법칙상 틀린 구조니까)

이렇게 하면 AI 는 "고양이가 날 수 있을까?"라는 상상에 빠질 수 없게 됩니다. 내용이 없으니, 오직 논리 규칙만 따를 수밖에 없기 때문입니다.

3. 여러 언어를 위한 "영어 중계" 전략

이 연구는 영어뿐만 아니라 스페인어, 한국어, 프랑스어 등 다양한 언어에서도 작동합니다.

비유: AI 는 영어를 가장 잘하는 수석 통역사입니다. 하지만 다른 언어 (예: 프랑스어) 로 된 문제를 바로 풀면, 그 언어의 뉘앙스 때문에 헷갈릴 수 있습니다.
해결책: 모든 문제를 영어 통역사에게 먼저 맡깁니다.
- 프랑스어 문제를 받아서, 논리 구조만 유지한 채 영어로 번역합니다.
- 그 다음, 위에서 설명한 '옷 벗기기' 과정을 영어로 진행합니다.
- 이렇게 하면 AI 가 가장 잘하는 영어 환경에서, 가장 정확한 논리 규칙을 적용할 수 있습니다.

4. 결과: "완벽한 논리, 제로 편향"

이 방법을 적용한 결과, 팀은 SemEval-2026이라는 세계적인 논리 평가 대회에서 상위 5 위에 올랐습니다.

기존 AI: 내용이 그럴듯하면 틀린 논리도 맞다고 함 (편향 발생).
이 팀의 AI: 내용이 뭐든 상관없이, 구조만 보고 100% 정확하게 맞고 틀림을 판단함.

요약

이 논문은 **"AI 가 논리를 잘하려면, '무엇에 대해' 이야기하는지 (내용) 는 잊어버리고, '어떻게' 이야기하는지 (구조) 만 기억하게 해야 한다"**는 아주 단순하지만 강력한 통찰을 보여줍니다.

마치 수학 문제를 풀 때, 숫자 뒤에 숨겨진 이야기 (예: "사과 3 개", "오렌지 5 개") 를 무시하고, 그냥 '3+5=8'이라는 계산 규칙만 따르는 것과 같습니다. 이 방법을 통해 AI 는 더 이상 속지 않고, 진짜 논리 전문가가 될 수 있게 되었습니다.

ITLC at SemEval-2026 Task 11: Normalization and Deterministic Parsing for Formal Reasoning in LLMs

1. 문제 상황: "맛있는 음식에 속는 AI"

2. 해결책: "논리 구조만 남기는 '탈의실'"

3. 여러 언어를 위한 "영어 중계" 전략

4. 결과: "완벽한 논리, 제로 편향"

요약

논문 요약: ITLC at SemEval-2026 Task 11

1. 문제 정의 (Problem)

2. 제안된 방법론 (Methodology)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

ITLC at SemEval-2026 Task 11: Normalization and Deterministic Parsing for Formal Reasoning in LLMs

1. 문제 상황: "맛있는 음식에 속는 AI"

2. 해결책: "논리 구조만 남기는 '탈의실'"

3. 여러 언어를 위한 "영어 중계" 전략

4. 결과: "완벽한 논리, 제로 편향"

요약

논문 요약: ITLC at SemEval-2026 Task 11

1. 문제 정의 (Problem)

2. 제안된 방법론 (Methodology)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

5. 의의 및 결론 (Significance)

유사한 논문

Using Optimal Transport as Alignment Objective for fine-tuning Multilingual Contextualized Embeddings

SQLBench: A Comprehensive Evaluation for Text-to-SQL Capabilities of Large Language Models

DAVIS: Planning Agent with Knowledge Graph-Powered Inner Monologue

Did somebody say "Gest-IT"? A pilot exploration of multimodal data management

LLMs Faithfully and Iteratively Compute Answers During CoT: A Systematic Analysis With Multi-step Arithmetics