Each language version is independently generated for its own context, not a direct translation.
1. 문제: AI 는 '구체적인 것'은 잘하지만 '추상적인 것'은 어려워해요
우리가 AI 에게 "사과"나 "자동차" 같은 구체적인 사물을 물어보면 AI 는 아주 잘 답합니다. 하지만 "자유 (Freedom)", "정의 (Justice)", **"경제 (Economy)"**처럼 눈에 보이지 않고 감각으로 느낄 수 없는 추상적인 개념을 물어보면 AI 는 헷갈려 합니다.
- 비유: AI 는 '사과'라는 과일을 보고 "빨갛고 둥글다"고 말해줄 수 있지만, "이 사과가 주는 '행복'의 의미는 무엇일까?"라고 물으면 머리가 아파합니다.
- 연구 결과: 논문은 최신 AI(예: GPT-4o, Llama 등) 가 이런 추상적인 문제를 풀 때, 기대했던 것보다 훨씬 못한다는 것을 증명했습니다. 인간이 95% 를 맞히는 문제를 AI 는 70% 정도밖에 못 맞혔습니다.
2. 실험: AI 에게 시험지를 주니 어떻게 했을까?
연구진은 SemEval-2021 이라는 '추상적 의미 독해 시험'을 AI 에게 치르게 했습니다. 지문과 질문이 있고, 빈칸에 들어갈 가장 적절한 추상적인 단어를 5 개 중 고르는 문제였습니다.
- 결과: AI 는 지문을 읽고 답을 고르는 '선다형' 문제를 풀 때, 마치 학생이 시험지를 보고 고민하는 것처럼 여러 번 시도해 보았지만 (Zero-shot, Few-shot 등), 여전히 정답률이 낮았습니다.
- 교훈: AI 가 아무리 똑똑해 보여도, '눈에 보이지 않는 개념'을 이해하는 능력은 아직 인간에 비해 부족합니다.
3. 해결책: 인간의 두뇌 방식을 모방한 '양방향 주의력'
연구진은 AI 가 추상적인 개념을 잘 이해하게 하기 위해, 인간의 두뇌가 작동하는 방식을 모방한 새로운 방법을 고안했습니다.
인간의 방식: 우리가 추상적인 문제를 풀 때, 단순히 지문만 읽지 않습니다.
- 먼저 지문을 보며 "어떤 단어가 들어갈까?" 고민합니다.
- 그다음 질문과 보기를 다시 보며 "아, 이 문맥에서는 이 단어가 맞구나!"라고 확인합니다.
- 이 과정을 반복하며 정답을 찾아냅니다.
AI 에 적용한 방법 (양방향 주의력 분류기):
연구진은 AI 가 지문과 보기를 서로 주고받으며 (양방향으로) 집중하게 만들었습니다.- 한 방향: 지문을 보고 보기를 찾음.
- 다른 방향: 보기를 보고 지문을 다시 확인함.
- 결과: 이 두 가지 시선을 하나로 합치니, AI 의 이해도가 크게 향상되었습니다. 마치 두 사람이 서로의 의견을 주고받으며 문제를 해결하는 것처럼 말이죠.
4. 성과: "작은 모델이 큰 AI 를 이겼다?"
놀랍게도, 거대한 최신 AI(GPT-4 등) 보다는, **작지만 잘 훈련된 기존 모델 (ELECTRA)**에 이 '양방향 주의력' 기술을 더했을 때 가장 좋은 성적을 거두었습니다.
- 성적 향상: 이 방법을 쓰니 정답률이 4%
3% 정도 올랐습니다. AI 의 세계에서는 1% 만 오르는 것도 엄청난 일인데, 34% 는 '우승'을 의미하는 큰 차이입니다. - 최종 순위: 이 기술을 쓴 모델은 해당 시험에서 상위 3 위 안에 들었습니다.
5. 결론: AI 는 아직 '철학자'가 되지 못했습니다
이 논문의 핵심 메시지는 다음과 같습니다.
- 현재 AI 의 한계: 최신 AI 는 사실이나 상식에는 강하지만, '자유', '정의' 같은 추상적인 개념을 깊이 이해하는 데는 여전히 약합니다.
- 해결의 열쇠: 거대한 모델을 무작정 키우는 것보다, 인간의 사고 방식 (양방향으로 생각하기) 을 모방한 구조를 작은 모델에 적용하는 것이 더 효과적일 수 있습니다.
- 미래: 이제 AI 는 단순히 "무엇인가"를 아는 것을 넘어, "그것이 무엇을 의미하는가"를 이해하는 단계로 나아가기 위해 더 정교한 사고 과정이 필요합니다.
한 줄 요약:
"AI 가 '사과'는 잘 알지만 '사랑'은 잘 모릅니다. 하지만 인간처럼 지문과 보기를 오가며 깊게 생각하게 (양방향 주의력) 만들면, AI 도 추상적인 개념을 훨씬 잘 이해하게 됩니다."
이런 논문을 받은편지함으로 받아보세요
관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.