Can LLMs Produce Original Astronomy Research in a Semester? A Graduate Class Experiment

이 논문은 2025 년 가을 학기 대학원 천문학 수업에서 LLM 을 활용한 연구 실험 결과를 보고하며, LLM 이 시간 절감에 일부 기여할 수 있으나 허위 인용, 복잡한 코드 생성 실패, 창의성 저해 등의 한계로 인해 아직 독립적인 과학적 연구 수행에는 부적합하다는 결론을 내립니다.

원저자: Ann Zabludoff, Chen-Yu Chuang, Parker Thomas Johnson, Yichen Liu, Brina Bianca Martinez, Neev Shah, Lucille Steffes, Gabriel Glen Weible

게시일 2026-03-30
📖 3 분 읽기☕ 가벼운 읽기

이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🌌 인공지능이 천문학 논문을 쓸 수 있을까? 2025 년 가을 학기 실험 보고서

이 글은 미국 애리조나 대학교 천문학 대학원생 7 명이 2025 년 가을 학기에 진행한 흥미로운 실험에 대한 보고서입니다. 그들은 "인공지능 (LLM) 이 우리가 모르는 새로운 천문학 주제를 연구해서, 진짜 학술지 논문을 쓸 수 있을까?"라는 의문을 가지고 실험을 했습니다.

이 실험의 결과를 마치 새로운 요리 레시피를 배우는 과정에 비유해서 쉽게 설명해 드릴게요.


1. 실험의 배경: "요리사 vs. AI 비서"

이 학생들은 모두 천문학 박사 과정 1 년생들이었습니다. 하지만 대부분이 '은하' 연구에 익숙하지 않은 초보자들이었습니다.

  • 목표: 단순히 요약한 레포트가 아니라, 실제 학술지에 낼 수 있는 수준의 새로운 연구 논문을 한 학기 안에 써내는 것.
  • 도구: ChatGPT, Claude, Gemini 등 최신 AI 모델들.
  • 상황: 학생들은 AI 를 '비서'처럼 썼습니다. 자료 찾기, 코드 짜기, 논문 초안 작성 등을 AI 에게 맡겼습니다.

2. AI 의 활약: "신속한 식재료 정리꾼"

학생들은 AI 가 초반 단계에서 정말 유용하게 썼다고 말합니다.

  • 비유: 만약 당신이 낯선 나라의 요리를 하려는데, 수백 권의 요리책을 일일이 읽어야 한다면 며칠이 걸릴까요? AI 는 그걸 1 초 만에 요약해 주었습니다.
  • 성공 사례:
    • "은하의 금속 함량과 별의 질량 분포는 어떤 관계가 있을까?" 같은 복잡한 주제를 AI 가 빠르게 정리해 주었습니다.
    • 코딩 실수 (오타) 를 찾아주거나, 간단한 그래프를 그리는 코드를 짜주는 데는 매우 능숙했습니다.
    • 한 학생은 AI 가 과학적 그래프를 보고 "이 데이터는 물리 법칙에 위배되네?"라고 지적해 주기도 했습니다.

3. AI 의 실패: "거짓말쟁이 비서와 망가진 주방 도구"

하지만 AI 는 본격적인 요리 (연구) 를 진행할 때 심각한 문제를 일으켰습니다. 약 20% 의 확률로 엉뚱한 일을 했습니다.

  • 가짜 레시피 (허위 인용):
    • AI 는 마치 진짜 책인 것처럼 존재하지 않는 논문이나 잘못된 링크를 가져다주었습니다.
    • 예시: "NGC 346 성단에서 젊은 별들을 연구한 2025 년 제임스 웹 우주망원경 논문"이라고 소개했는데, 실제로 링크를 누르면 '은하 외곽의 화학 성분'에 대한 전혀 다른 글이 나왔습니다. 학생들은 모든 자료를 직접 확인해야만 했습니다.
  • 망가진 주방 도구 (코드 오류):
    • AI 가 짜준 코드는 실행은 되지만, 물리적으로 말이 안 되는 결과를 내놓았습니다.
    • 예시: 은하의 중력장을 계산할 때, 두 개의 서로 다른 논문을 섞어서 엉뚱한 수치를 넣었습니다. AI 는 "내가 맞다"며 고집을 부리기도 했습니다.
  • 접근 불가 (데이터 다운로드 실패):
    • "이 데이터베이스에서 자료를 다운로드해 줘"라고 하면, AI 는 링크만 알려줄 뿐, 실제로 자료를 가져오거나 분석하는 코드는 제대로 짜지 못했습니다. 마치 "식재료 가게 위치는 알려주지만, 직접 사러 가지는 못하는 비서"와 같았습니다.

4. 학생들의 결론: "시간은 아꼈을까?"

결과적으로 학생들의 반응은 반반이었습니다.

  • 절반은 "시간을 아꼈다"고 했습니다: "내가 은하 연구에 대해 아무것도 몰랐는데, AI 가 기초 지식을 빠르게 정리해 줘서 시작할 수 있었다."
  • 나머지는 "시간을 낭비했다"고 했습니다: "AI 가 틀린 정보를 찾아내느라, 내가 직접 자료를 읽는 것보다 더 오래 걸렸다."

5. 핵심 교훈: "요리사는 여전히 인간이어야 한다"

이 실험을 통해 얻은 가장 중요한 교훈은 다음과 같습니다.

  1. AI 는 '조수'일 뿐 '요리사'가 될 수 없다: AI 는 아이디어를 내고, 코드를 짜는 데는 도움이 되지만, **과학적 통찰력 (맛보기)**이나 정확한 데이터 검증은 인간이 직접 해야 합니다.
  2. 창의성의 위기: AI 가 모든 단계를 다 해준다면, 학생들은 "왜 이 연구를 해야 하지?"라는 질문 자체를 던지는 즐거움과 사고의 과정을 잃어버릴 수 있습니다.
  3. 미래의 방향: AI 개발자들은 "가짜 인용을 하지 않게 하고", "데이터베이스에 직접 접속할 수 있게" 고쳐야 합니다. 학생들은 앞으로 AI 를 쓸 때 **"무엇을 믿고, 무엇을 의심할지"**를 먼저 배워야 합니다.

📝 한 줄 요약

"AI 는 천문학 연구를 위한 '초고속 정보 정리꾼'과 '코드 조수'로는 훌륭하지만, '진실한 과학자'가 되려면 여전히 인간의 눈과 손이 필요하다."

이 실험은 AI 가 과학계를 어떻게 바꿀지, 그리고 우리가 어떻게 AI 와 함께 살아갈지 생각하게 만드는 중요한 신호탄이었습니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →