Can AI be a Teaching Partner? Evaluating ChatGPT, Gemini, and DeepSeek across Three Teaching Strategies

이 논문은 C 프로그래밍 초보자를 대상으로 ChatGPT, Gemini, DeepSeek 의 세 가지 대형 언어 모델이 예시·설명·유추 및 소크라틱 방법 등 세 가지 교수 전략 하에서 어떻게 작동하는지 비교 평가한 결과, ChatGPT 와 Gemini 가 DeepSeek 보다 전반적으로 더 우수한 교수 성과를 보였음을 밝혔습니다.

Talita de Paula Cypriano de Souza, Shruti Mehta, Matheus Arataque Uema, Luciano Bernardes de Paula, Seiji Isotani

게시일 2026-03-31
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능 (AI) 이 정말로 훌륭한 '선생님'이 될 수 있을까?"**라는 질문에 답하기 위해 쓴 연구 보고서입니다.

마치 **세 명의 새로운 '가상 교사' (ChatGPT, Gemini, DeepSeek)**를 데려와서, 초보자에게 C 프로그래밍을 가르치는 시험을 치른 것과 같습니다. 연구팀은 이 AI 들이 단순히 정답을 알려주는 '답안지'가 아니라, 학생이 스스로 생각하게 만드는 '진짜 교사'처럼 행동할 수 있는지 확인했습니다.

이 연구의 핵심 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 시험의 세 가지 방법 (수업 스타일)

연구팀은 이 세 명의 AI 교사에게 세 가지 다른 수업 방식을 시켰습니다.

  • 방법 1: "예시 보여주기" (Examples)

    • 비유: 요리사에게 "파스타 만드는 법을 알려줘"라고 했을 때, 바로 완성된 파스타를 주는 게 아니라, **"이런 식으로 면을 삶고 소스를 섞으면 돼"**라고 비슷한 요리를 보여주고 학생이 따라 하게 하는 방식입니다.
    • 결과: 세 AI 모두 꽤 잘했습니다. 하지만 DeepSeek은 가끔 "완성된 파스타 (정답)"를 바로 내주는 실수를 했습니다. ChatGPTGemini는 학생이 스스로 요리할 수 있도록 예시를 잘 보여줬습니다.
  • 방법 2: "비유와 설명" (Explanations & Analogies)

    • 비유: 복잡한 개념을 설명할 때, **"배열 (Array) 은 옷장 서랍과 같아요. 각 서랍에 옷을 넣는 거죠"**처럼 친숙한 사물에 비유해서 설명하는 방식입니다.
    • 결과: ChatGPT가 가장 명쾌하고 이해하기 쉬운 비유를 사용했습니다. DeepSeek은 설명이 조금 어렵거나 학생 수준에 맞지 않는 경우가 많았습니다.
  • 방법 3: "소크라테스식 질문" (Socratic Method)

    • 비유: 학생이 "왜 이렇게 해?"라고 물으면, AI 가 바로 답을 말해주지 않고 **"그럼 너는 어떻게 생각해?", "만약에 반대로 하면 어떻게 될까?"**라고 계속 질문을 던져 학생 스스로 답을 찾게 만드는 방식입니다. (가장 어려운 수업 방식)
    • 결과: ChatGPTGemini는 질문을 잘 이어가며 학생을 이끌었습니다. 반면 DeepSeek은 질문을 던지는 대신, 가끔은 답을 먼저 알려주거나 질문의 흐름이 끊기는 모습을 보였습니다.

2. 심사위원들의 평가 (누가 가장 잘했을까?)

6 명의 전문가 심사위원 (교사들) 이 이 세 AI 를 평가했습니다.

  • 🏆 1 위 & 2 위: ChatGPT 와 Gemini

    • 이 두 AI 는 "훌륭한 조교" 수준이었습니다.
    • 학생이 모르는 것을 물어보면 바로 답을 주지 않고, 예시를 보여주거나 비유를 들거나, 질문을 던져서 스스로 생각하게 만들었습니다.
    • 특히 ChatGPT는 설명이 가장 명확했고, Gemini는 예시와 비유의 연결이 잘 되어 있었습니다.
  • 🥉 3 위: DeepSeek

    • 이 AI 는 "열심히 하지만 아직 미숙한 조교" 수준이었습니다.
    • 지식은 많았지만, 학생의 수준을 잘 파악하지 못했습니다. 때로는 너무 어려운 설명을 하거나, 아예 정답을 바로 알려주는 등 '가르치는 기술'이 부족했습니다.
    • 특히 "소크라테스식 질문" 방식에서는 다른 두 AI 에 비해 많이 뒤처졌습니다.

3. 연구의 핵심 교훈 (무엇을 배웠을까?)

  1. 정답을 아는 것과 가르치는 것은 다릅니다.
    AI 가 문제를 다 풀 수는 있어도, 그것을 학생이 이해하도록 **가르치는 것 (Pedagogy)**은 별개의 기술입니다. 이 연구는 AI 들이 '지식'은 많지만, '가르치는 기술'은 아직 완벽하지 않음을 보여줍니다.

  2. 지시명령 (프롬프트) 이 중요합니다.
    AI 가 어떻게 행동할지는 우리가 내리는 지시 (예: "너는 학생을 가르치는 선생님 역할을 해") 에 따라 달라집니다. 잘 설계된 지시명령을 주면 AI 는 훨씬 훌륭한 교사가 될 수 있습니다.

  3. 모든 AI 가 똑같지 않습니다.
    같은 'AI'라고 해도 모델마다 성격과 실력이 다릅니다. 교육용으로 쓸 때는 어떤 AI 가 어떤 수업 방식에 더 적합한지 신중하게 골라야 합니다.


4. 결론: AI 는 교사를 대체할까?

이 연구는 **"아직은 아닙니다"**라고 말합니다.

AI 는 훌륭한 **보조 도구 (조교)**가 될 수 있습니다. 반복적인 설명을 하거나, 학생이 모르는 개념을 비유로 설명해 주는 데는 탁월합니다. 하지만 학생의 감정을 읽거나, 복잡한 상황을 유연하게 대처하는 진짜 교사의 역할을 완전히 대체하기에는 아직 부족합니다.

한 줄 요약:

"AI 는 똑똑한 '비서'나 '조교'는 될 수 있지만, 아직은 학생의 마음을 읽고 스스로 생각하게 만드는 '명강사'가 되기 위해 더 많은 훈련 (연구) 이 필요합니다."

이 연구는 앞으로 교육 현장에서 AI 를 어떻게 더 잘 활용하고, 어떤 AI 를 선택해야 할지에 대한 나침반을 제시해 줍니다.