Each language version is independently generated for its own context, not a direct translation.
🎓 1. 실험의 설정: "AI 수험생 4 인의 대결"
연구진은 2015 년부터 2025 년까지 치러진 **AP 물리 1(기초 역학)**과 AP 물리 2(전자기, 열, 광학 등) 시험의 서술형 문제들을 준비했습니다. 그리고 여기에 네 명의 'AI 수험생'을 투입했습니다.
- 참가자: ChatGPT, Gemini, Claude, DeepSeek (최신 버전들)
- 규칙: "너는 AI 가 아니라 고등학생이야. 시험지 그대로만 보고 답을 써. 그림도 보고 계산도 해."
- 채점: 실제 물리 교수님 3 분이 College Board(미국 대학입시 위원회) 의 채점 기준에 따라 점수를 매겼습니다.
📊 2. 결과 요약: "평균 점수는 훌륭하지만, 실력은 제각각"
🌟 전체적인 성적:
네 AI 모두 **82~92%**라는 놀라운 평균 점수를 받았습니다. 이는 일반 고등학생보다 훨씬 잘하는 수준입니다. 특히 공식을 대입해서 계산하는 문제에서는 거의 완벽에 가까웠습니다. 마치 수학 공식만 외운 천재 학생처럼 보이죠.
📉 하지만 숨겨진 문제:
점수가 높은 것만 보면 좋지만, 매년 점수가 들쭉날쭉했습니다. 어떤 해에는 100 점, 어떤 해에는 70 점도 받았습니다. 이는 AI 가 문제를 '이해'해서 푼 게 아니라, 특정 패턴을 맞춰서 푼다는 신호일 수 있습니다.
🏆 순위 경쟁 (물리 2 기준):
- 1 위: Gemini 와 DeepSeek (가장 안정적이고 점수가 높음)
- 중위: Claude
- 하위: ChatGPT (점수 변동이 가장 심함)
- 물리 1 은 네 AI 모두 실력이 비슷해서 순위가 매년 뒤바뀌었습니다.
⚠️ 3. AI 의 치명적인 약점: "눈이 보이지 않는 천재"
AI 가 틀린 문제를 분석해보니, 계산 실수보다는 시각적·공간적 이해에서 큰 실수를 했습니다. 이를 비유하자면 다음과 같습니다.
그림 읽기 실수 (Diagram Errors):
- 상황: 경사면 그림을 보고 물체가 언제 떨어질지 예측하는 문제.
- AI 의 실수: "높이가 같으니 동시에 떨어지겠지!"라고 생각했지만, 실제로는 경사각이 다르면 가속도가 달라집니다.
- 비유: 지도는 잘 보는데, 실제 길의 경사나 구불구불한 모양은 못 보는 내비게이션 같습니다.
그래프 해석 실패 (Graph Errors):
- 상황: 압력과 부피 그래프를 보고 기체의 일을 계산하는 문제.
- AI 의 실수: 그래프의 숫자를 제대로 읽지 못해 엉뚱한 값을 계산했습니다.
- 비유: 숫자만 보고 대충 추측하는 사람처럼, 그래프의 정확한 좌표를 읽지 못했습니다.
방향 감각 상실 (Vector & Right-Hand Rule):
- 상황: 자석과 전류의 방향을 3 차원 공간에서 파악하는 문제.
- AI 의 실수: "오른손 법칙"을 적용할 때 방향을 거꾸로 잡거나, 전하의 부호를 무시했습니다.
- 비유: 3 차원 공간 감각이 없는 사람이 2 차원 그림을 보고 3 차원 방향을 상상하려다 헷갈리는 상황입니다.
회로 오해 (Circuit Errors):
- 상황: 전기 회로에서 저항이 어떻게 연결되었는지 파악.
- AI 의 실수: 직렬과 병렬을 혼동해서 전체 저항 계산을 틀렸습니다.
- 비유: 레고 블록을 조립할 때 연결 부위를 잘못 파악해서 전체 구조가 무너지는 것과 같습니다.
💡 4. 결론과 교훈: "도구로 쓰되, 맹신은 금물"
이 연구는 우리에게 두 가지 중요한 메시지를 줍니다.
AI 는 훌륭한 '계산 도우미'입니다:
복잡한 공식을 적용하고, 단계를 나누어 계산하는 작업에서는 인간보다 빠르고 정확할 수 있습니다. 숙제나 개념 복습에 도움을 줄 수 있죠.하지만 '창의적 사고'와 '시각적 이해'는 아직 부족합니다:
그림을 보고 상황을 상상하거나, 3 차원 공간에서 방향을 파악하거나, 여러 개념을 복합적으로 연결하는 문제에서는 여전히 실수합니다. 특히 **한 번 그림을 잘못 보면, 그 뒤의 모든 계산이 틀리는 '연쇄 오류'**가 발생합니다.
👨🏫 선생님들과 학생들을 위한 조언:
- AI 를 '스승'이 아니라 '비서'로 쓰세요: AI 가 답을 알려줄 때, 그 답이 논리적으로 맞는지, 그림을 제대로 읽었는지 반드시 인간이 확인해야 합니다.
- 실수를 교재로 쓰세요: AI 가 틀린 그림 해석이나 방향 감각 실수는 학생들에게 "이런 실수를 하면 안 된다"는 좋은 예시가 될 수 있습니다.
🚀 한 줄 요약
"AI 는 물리 공식 계산은 천재지만, 그림을 보고 3 차원 공간을 상상하는 능력은 아직 초보생 수준입니다. 그래서 우리는 AI 를 믿되, 항상 눈으로 확인해야 합니다."