EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery

이 논문은 아이디어 생성, 실험 실행, 진화 관리라는 세 가지 전문 에이전트와 지속적 기억 모듈을 통해 상호작용 기록을 기반으로 연구 전략을 지속적으로 진화시켜 기존 AI 과학자 시스템의 한계를 극복하고 과학적 발견의 효율성과 성공률을 획기적으로 향상시킨 'EvoScientist' 프레임워크를 제안합니다.

Yougang Lyu, Xi Zhang, Xinhao Yi, Yuyue Zhao, Shuyu Guo, Wenxiang Hu, Jan Piotrowski, Jakub Kaliski, Jacopo Urbani, Zaiqiao Meng, Lun Zhou, Xiaohui Yan

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

EvoScientist: 스스로 성장하는 'AI 과학자 팀'의 이야기

이 논문은 EvoScientist(이보사이언티스트)라는 새로운 시스템을 소개합니다. 쉽게 말해, 이는 "단순히 명령을 받아 일만 하는 로봇"이 아니라, **실수를 통해 배우고 성장하는 'AI 과학자 팀'**입니다.

기존의 AI 과학자 프로그램들은 마치 매번 처음부터 다시 시작하는 신입 사원과 같았습니다. "이 실험 실패했네? 알았어, 다음엔 똑같은 실수를 안 할게!"라고 기억하지 못하고, 같은 실수를 반복하거나 이미 실패한 아이디어를 다시 꺼내 들었습니다.

하지만 EvoScientist 는 다릅니다. 이 시스템은 3 명의 전문가로 구성된 팀으로, 서로 협력하며 과거의 경험을 '기억'으로 저장해 두었다가 다음 과제에 활용합니다.


🧠 1. 팀원 소개: 3 명의 AI 전문가

이 시스템은 세 가지 역할을 맡은 AI 에이전트 (가상 인격) 로 구성되어 있습니다.

  1. **연구자 **(Researcher Agent)

    • 역할: "우리가 무엇을 연구할까?"라는 새로운 아이디어를 냅니다.
    • 특징: 단순히 막연한 상상이 아니라, 과거에 어떤 아이디어가 성공했고 어떤 것이 실패했는지 기억해 내어 더 현실적이고 창의적인 제안을 합니다.
  2. **엔지니어 **(Engineer Agent)

    • 역할: 연구자가 낸 아이디어를 코드로 구현하고 실험을 실행합니다.
    • 특징: "이 코드가 왜 안 될까?"를 분석하고, 과거에 어떤 데이터 처리 방식이나 훈련 방법이 잘 작동했는지 기억해 내어 실패 확률을 줄입니다.
  3. **진화 관리자 **(Evolution Manager)

    • 역할: 팀의 두뇌이자 기록 관리자입니다.
    • 특징: 연구자와 엔지니어가 한 모든 일 (성공과 실패) 을 분석하여 '지식'으로 만듭니다. 마치 팀이 경험한 모든 것을 수첩에 적어두는 것과 같습니다.

📚 2. 두 가지 '기억 수첩': 실패를 성공으로 바꾸는 비결

이 시스템의 핵심은 **두 가지 기억 **(Memory)을 가지고 있다는 점입니다.

  • **📝 아이디어 수첩 **(Ideation Memory)

    • 내용: "어떤 연구 방향이 유망했는지"와 "어떤 방향은 처음부터 틀렸는지"를 기록합니다.
    • 비유: 요리사가 "이 조합은 맛이 없었어 (실패)"라고 적어두고, 다음에 같은 실수를 하지 않도록 하는 레시피 노트입니다.
    • 효과: 연구자는 실패한 아이디어를 다시 꺼내지 않고, 성공 가능성이 높은 방향만 골라냅니다.
  • **🛠️ 실험 수첩 **(Experimentation Memory)

    • 내용: "어떤 코드 작성법이나 데이터 처리 방식이 잘 작동했는지"를 기록합니다.
    • 비유: 엔지니어가 "이런 버그는 이 방법으로 고치면 돼"라고 적어두는 수리 매뉴얼입니다.
    • 효과: 엔지니어는 처음부터 코드를 다 짜는 게 아니라, 과거에 검증된 방법을 가져와서 실행 성공률을 높입니다.

🚀 3. 어떻게 작동할까요? (진화의 과정)

EvoScientist 는 다음과 같은 과정을 통해 스스로 발전합니다.

  1. 목표 설정: "AI 를 이용한 새로운 의료 진단법을 찾아줘"라고 요청합니다.
  2. 기억 검색: 연구자와 엔지니어는 과거의 '수첩'을 뒤져 관련 성공/실패 사례를 찾아옵니다.
  3. 아이디어 생성 및 실행: 과거의 교훈을 바탕으로 더 나은 아이디어를 내고, 더 안정적인 코드로 실험합니다.
  4. 결과 기록: 실험이 끝난 후, 진화 관리자가 "이번엔 이렇게 성공했어", "저건 이렇게 실패했어"라고 수첩에 새로운 지식을 추가합니다.
  5. 다음 단계: 다음 과제를 받을 때, 이 새로운 지식을 바탕으로 더 똑똑하게 행동합니다.

이 과정은 마치 비행기 조종사가 비행 데이터를 기록해 다음 비행에서 더 안전하게 착륙하는 것과 같습니다.


🏆 4. 결과는 어땠나요?

이 시스템은 실제로 매우 뛰어난 성과를 거두었습니다.

  • 아이디어 품질: 기존에 있던 7 개의 유명 AI 시스템 (오픈소스 및 상업용) 보다 더 창의적이고 실현 가능한 아이디어를 냈습니다.
  • 실행 성공률: 코드를 실행했을 때 오류가 나고 멈추는 경우가 훨씬 줄었습니다.
  • 실제 논문 발표: 이 시스템이 작성한 6 편의 연구 논문이 실제로 국제 학술회 (ICAIS 2025) 에 모두 채택되었습니다. 그중 하나는 최우수 논문상을, 다른 하나는 AI 심사위원 특별상을 받기도 했습니다!

💡 요약

EvoScientist는 단순히 지식을 검색하는 도구가 아니라, **실수를 통해 배우고 성장하는 '지속 가능한 학습자'**입니다.

  • 기존 시스템: "나는 오늘도 똑같은 실수를 반복할게." (정적)
  • EvoScientist: "어제 실패한 걸 기억했으니, 오늘은 더 잘할 수 있어!" (진화)

이 기술은 앞으로 과학 연구의 속도를 획기적으로 높이고, 인간 과학자들이 더 창의적인 일에 집중할 수 있도록 돕는 최고의 파트너가 될 것입니다.