AutoSAM: an Agentic Framework for Automating Input File Generation for the SAM Code with Multi-Modal Retrieval-Augmented Generation

이 논문은 다중 모달 검색 증강 생성 (RAG) 기술을 활용하여 비정형 공학 문서에서 데이터를 추출하고 검증된 SAM 입력 파일을 자동 생성하는 에이전트 기반 프레임워크인 'AutoSAM'을 제안하며, 다양한 원자로 시나리오에서 높은 정확도와 투명성을 입증합니다.

Zaid Abulawi (Department of Nuclear Engineering, Texas A&M University, Nuclear Science and Engineering Division, Argonne National Laboratory), Zavier Ndum Ndum (Department of Nuclear Engineering, Texas A&M University, Nuclear Science and Engineering Division, Argonne National Laboratory), Eric Cervi (Nuclear Science and Engineering Division, Argonne National Laboratory), Rui Hu (Nuclear Science and Engineering Division, Argonne National Laboratory), Yang Liu (Department of Nuclear Engineering, Texas A&M University)

게시일 2026-03-27
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏗️ 1. 문제 상황: "복잡한 설계도만 보고 집을 짓는 건축가"

원자력 발전소 같은 복잡한 시스템을 설계하려면, 엔지니어들은 수백 페이지에 달하는 설계 보고서, 복잡한 도면, 엑셀 표, 그리고 사진 자료들을 뒤져야 합니다. 이 모든 정보를 하나하나 찾아서 컴퓨터 프로그램이 알아들을 수 있는 '코드 (입력 파일)'로 직접 타이핑해야 합니다.

  • 현재의 문제: 이 과정은 마치 수천 장의 낡은 설계도, 손으로 쓴 메모, 그리고 그림을 보고 직접 건물을 짓는 건축가와 같습니다. 실수하기 쉽고, 시간이 너무 오래 걸려서 (몇 주에서 몇 달), 지루한 업무의 병목 현상이 됩니다.

🤖 2. 해결책: "AutoSAM"이라는 똑똑한 보조 인턴

이 논문에서 소개한 AutoSAM은 바로 그 건축가를 도와주는 초지능 AI 보조 인턴입니다. 이 인턴은 다음과 같은 능력을 갖추고 있습니다.

🧠 A. "전문가 교재"를 달달 외운 상태 (RAG 및 시스템 지시)

이 인턴은 SAM 프로그램의 사용 설명서와 이론서를 완벽하게 공부했습니다. 하지만 단순히 책만 읽은 게 아니라, **실제 설계도 (PDF, 이미지, 엑셀)**를 어떻게 해석해야 하는지도 배웠습니다.

  • 비유: 마치 원자력 공학 전공 서적과 설계 매뉴얼을 통째로 외운 천재 인턴이 옆에 앉아 있는 것과 같습니다.

🔍 B. "눈"과 "손"을 가진 탐정 (멀티모달 처리)

인간은 텍스트만 읽을 수 있지만, 이 AI 는 이미지 속의 도면, 사진 속의 그래프, PDF 의 표까지 모두 이해할 수 있습니다.

  • 비유: 설계도 위에 그려진 **파이프 연결선 (이미지)**을 보고 "아, 여기가 연결되는구나!"라고 이해하고, 옆에 있는 **문서 (PDF)**에서 "물 온도는 600 도야"라고 적힌 내용을 찾아내서 **엑셀 (스프레드시트)**의 숫자와도 맞춰보는 탐정 같은 역할입니다.

🛠️ C. "검증"을 거치는 안전 장치 (중간 단계)

이 인턴은 바로 최종 건물을 짓지 않습니다. 먼저 **사람이 확인할 수 있는 중간 설계도 (중간 구조 파일)**를 만듭니다.

  • 비유: 인턴이 "여기 파이프 길이가 10m 인 것 같은데, 맞나요?"라고 중간 설계도를 보여줍니다. 엔지니어 (사람) 가 이를 확인하고 "아, 여기는 12m 야"라고 수정하거나 "이건 내가 추측해서 넣은 거야"라고 표시합니다. 최종적으로 컴퓨터에 입력되는 코드는 사람이 최종 확인을 거친 후 만들어집니다.

🧪 3. 실제 테스트: 네 가지 난이도별 미션

저자들은 이 AI 를 네 가지 다른 난이도의 미션으로 시험해 보았습니다.

  1. 파이프 하나 (쉬움): 엑셀 표만 주어졌을 때, 파이프 하나를 정확히 모델링할 수 있는지 확인. (✅ 성공)
  2. 연료와 열 (중간): 파이프에 열이 가해지고 온도가 변하면 반응이 어떻게 바뀌는지 계산. (✅ 성공)
  3. 복잡한 원자로 (ABTR): 도면 (이미지) 과 문서 (PDF) 를 섞어서 복잡한 원자로 구조를 재구성. (✅ 성공)
  4. 전체 순환 시스템 (MSRE): 원자로에서 열을 빼고 다시 돌아오는 거대한 순환 시스템 전체를 도면과 문서만으로 재구성. (✅ 성공)

📊 4. 결과: 얼마나 잘했을까?

  • 엑셀 데이터: 100% 완벽하게 처리했습니다.
  • 문서 (PDF) 텍스트: 약 88% 를 정확히 찾아냈습니다. (나머지는 사람이 채워주면 됩니다.)
  • 도면 (이미지): 도면에서 필요한 기하학적 정보 (길이, 위치 등) 를 100% 완벽하게 추출했습니다.

💡 5. 결론: "설계도만 주면, 나머지는 내가 할게"

이 연구의 핵심 메시지는 **"모델링이 프롬프트 (명령) 가 되는 시대"**가 왔다는 것입니다.

  • 과거: 엔지니어는 설계도, 문서, 표를 뒤져서 직접 코드를 짜야 했습니다.
  • 미래 (AutoSAM): 엔지니어는 "이게 원자로 설계도야, 이 문서가 재료 데이터야"라고 AI 에게 주면, AI 가 모든 정보를 찾아서 안전하고 검증된 코드로 만들어줍니다.

중요한 점: 이 AI 는 엔지니어를 대체하는 것이 아니라, **엔지니어의 시간을 아껴주고 실수를 줄여주는 '최고의 파트너'**입니다. 최종 결정과 책임은 여전히 인간에게 있지만, AI 가 지루하고 반복적인 일을 대신해 줌으로써 엔지니어는 더 중요한 안전성과 설계 품질에 집중할 수 있게 됩니다.


한 줄 요약:

"AutoSAM 은 원자력 설계도, 문서, 그림을 모두 읽어 이해하고, 사람이 최종 확인만 하면 바로 실행 가능한 컴퓨터 코드를 만들어주는 똑똑한 AI 비서입니다."