Multi-Agent Collaboration for Automated Design Exploration on High Performance Computing Systems

이 논문은 고성능 컴퓨팅 시스템에서 대규모 설계 공간을 탐색하기 위해 전문 에이전트들이 협력하는 LLM 기반의 MADA 프레임워크를 제안하며, 이를 통해 관성 핵융합의 Richtmyer-Meshkov 불안정성 억제와 같은 복잡한 과학적 설계 작업을 자동화하고 최적화하는 것을 입증합니다.

Harshitha Menon, Charles F. Jekel, Kevin Korner, Brian Gunnarson, Nathan K. Brown, Michael Stees, M. Giselle Fernandez-Godino, Walter Nissen, Meir H. Shachar, Dane M. Sterbentz, William J. Schill, Yue Hao, Robert Rieben, William Quadros, Steve Owen, Scott Mitchell, Ismael D. Boureima, Jonathan L. Belof

게시일 2026-03-13
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 1. 문제 상황: "혼자서 모든 일을 해야 하는 고된 과학자"

과거에 과학자들은 새로운 실험을 할 때, 마치 혼자서 거대한 공장을 운영하는 사장님 같았습니다.

  • 설계: 실험용 기계 (모델) 를 직접 설계하고,
  • 자재 준비: 필요한 부품 (메쉬/격자) 을 직접 다듬고,
  • 작업 지시: 공장의 기계 (슈퍼컴퓨터) 에 실험을 지시하고,
  • 결과 분석: 나온 데이터를 직접 읽고, "아, 이걸로 실패했네. 다시 설계해야지"라고 생각하며 다음 작업을 계획했습니다.

이 과정은 매우 지루하고 시간이 많이 걸려서, 과학자들이 진짜 중요한 '발견'을 하는 시간보다 '일정 관리'와 '조작'에 시간을 더 많이 썼습니다.

🚀 2. 해결책: "MADA, 과학자를 위한 AI 팀장"

이 논문은 MADA라는 시스템을 제안합니다. 이는 거대 언어 모델 (LLM, 즉 고도화된 AI) 을 기반으로 한 전문가들로 구성된 팀입니다. 과학자는 이제 '팀장'이 되어 큰 그림만 지시하면, 팀원들이 모든 세부 작업을 알아서 처리해 줍니다.

MADA 팀에는 세 가지 핵심 '전문가 에이전트'가 있습니다.

① 조지미 (Geometry Agent, GA) - "건축가"

  • 역할: 실험을 위한 3D 모델과 격자 (메쉬) 를 자동으로 만듭니다.
  • 비유: 과학자가 "이런 모양의 벽을 만들어줘"라고 말하면, 조지미는 Cubit이나 PMesh라는 전문 도구를 이용해 그 벽을 자동으로 설계하고 자재 (메쉬) 를 준비합니다. 과학자가 직접 CAD 프로그램을 다루지 않아도 됩니다.

② 지미 (Job Management Agent, JMA) - "현장 감독"

  • 역할: 준비된 실험을 슈퍼컴퓨터에 보내고, 실행 상태를 지켜봅니다.
  • 비유: 조지미가 만든 설계도를 Flux라는 슈퍼컴퓨터 관리 시스템에 제출합니다. "이 실험을 100 개 동시에 돌려줘"라고 명령하면, 지미는 컴퓨터 자원을 할당하고 "어느 실험이 끝났고, 어느 것이 실패했는지"를 실시간으로 체크합니다.

③ 아이다 (Inverse Design Agent, IDA) - "전략가"

  • 역할: 실험 결과를 분석하고, "다음엔 무엇을 시도해 볼까?"를 결정합니다.
  • 비유: 지미가 가져온 결과를 보고 "이번 실험은 벽이 너무 약했네. 다음엔 벽 두께를 줄이고 모양을 약간 비틀어보자"라고 새로운 아이디어를 제안합니다. 단순히 결과를 읽는 것을 넘어, 왜 그런 결과가 나왔는지 추론하고 더 나은设计方案을 찾아냅니다.

🛠 3. 어떻게 소통할까? "MCP (모델 컨텍스트 프로토콜)"

이 세 에이전트와 과학자가 사용하는 도구들 (Cubit, Laghos 시뮬레이션 코드 등) 이 서로 말을 통하게 해주는 통역사가 필요합니다. 이 논문에서는 MCP라는 표준 규약을 사용했습니다.

  • 비유: 마치 모든 에이전트가 **영어 (MCP)**만 할 줄 안다면, 어떤 도구든 연결해서 바로 대화할 수 있는 것과 같습니다. 새로운 도구가 생겼을 때도, 에이전트 코드를 고칠 필요 없이 통역사 (MCP 서버) 만 연결하면 됩니다.

🧪 4. 실제 사례: "폭풍 속의 물방울을 제어하다"

이 팀이 실제로 어떤 일을 해냈는지 두 가지 시나리오로 보여줍니다.

시나리오 A: "실제 슈퍼컴퓨터로 정밀하게 실험하기"

  • 목표: 핵융합 연구에서 중요한 '리드미 - 메슈커 불안정성 (RMI)'을 억제하는 것. (쉽게 말해, 충격파가 부딪힐 때 물이 튀는 현상을 막는 것)
  • 과정:
    1. 과학자가 "물 튀는 현상을 줄여줘"라고 요청.
    2. 조지미가 실험용 3D 모델을 만들고, 지미가 슈퍼컴퓨터 (Tuolumne) 에 실험을 40 회 실행.
    3. 아이다가 결과를 분석하며 "이 모양이 가장 튀는 게 적네"라고 찾아냄.
  • 결과: 과학자가 직접 했다면 며칠 걸렸을 일을 40 분 만에 끝냈고, 실험 성공률을 높였습니다.

시나리오 B: "가상 시뮬레이션으로 빠르게 탐색하기"

  • 목표: 같은 문제를 더 빠르게 해결하기 위해, 실제 실험 대신 **AI 예측 모델 (서로게이트 모델)**을 사용.
  • 과정: 실제 실험은 20 분 걸리지만, AI 예측 모델은 0.1 초 만에 결과를 냅니다.
  • 결과: 아이다가 수백 가지 경우를 순식간에 시도하며 최적의 해답을 찾았습니다. 특히, "왜 이 모양이 좋은지"에 대한 **이유 (추론 과정)**를 인간이 이해할 수 있는 언어로 설명해 주었습니다. (예: "대칭적으로 반대 방향의 값을 주면 물이 튀는 게 가장 적어요")

💡 5. 핵심 요약: 왜 이것이 중요한가?

이 논문은 단순히 "컴퓨터가 더 빨라졌다"는 이야기가 아닙니다.

  1. 과학자의 역할 변화: 과학자는 이제 "어떻게 실험을 돌릴까?"라는 기술적 고민에서 해방되어, **"무엇을 발견할까?"**라는 본질적인 질문에 집중할 수 있게 되었습니다.
  2. 자동화된 협업: AI 에이전트들이 서로 협력하며 설계, 실행, 분석을 자동으로 반복합니다.
  3. 이해 가능한 AI: 단순히 답만 주는 것이 아니라, 왜 그 답을 선택했는지에 대한 논리를 설명해 주어 과학자가 신뢰하고 검증할 수 있습니다.

한 줄 요약:

"MADA 는 과학 실험을 **'혼자서 모든 걸 하는 고된 노동'**에서 **'전문가 팀이 알아서 처리하는 스마트 프로젝트'**로 바꿔주는, 과학 발견을 가속화하는 AI 팀장입니다."