InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis

이 논문은 X-ray 비파괴 검사에서 기존 딥러닝 방식의 한계를 극복하고, SDMSD 탐지기와 증거 기반 반성 (EGR) 도구를 LMM 에이전트가 조율하여 높은 정확도와 해석 가능성을 갖춘 신뢰할 수 있는 분석을 제공하는 'InsightX Agent' 프레임워크를 제안합니다.

Jiale Liu, Huan Wang, Yue Zhang, Xiaoyu Luo, Jiaxiang Hu, Zhiliang Liu, Min Xie

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

INSIGHTX 에이전트: X-ray 검사용 '똑똑한 검사관' 이야기

이 논문은 산업 현장에서 쓰이는 X-ray 비파괴 검사(NDT)의 문제를 해결하기 위해 개발된 새로운 인공지능 시스템, **'INSIGHTX 에이전트'**에 대해 설명합니다.

기존의 AI 는 단순히 "여기에 구멍이 있어요"라고만 말했지만, 이 새로운 시스템은 **왜 그걸 구멍이라고 생각했는지 설명하고, 스스로 의심하며, 인간과 대화할 수 있는 '생각하는 검사관'**이 되었습니다.

이 복잡한 기술을 쉽게 이해할 수 있도록 세 가지 핵심 역할로 나누어 설명해 드리겠습니다.


1. 문제점: 기존 AI 는 '무뚝뚝한 자동판매기' 같았습니다

기존의 X-ray 검사 AI 는 마치 자동판매기와 같았습니다.

  • 입력: X-ray 사진을 넣으면
  • 출력: "여기에 결함이 있습니다 (좌표: 123, 456)"라고 딱딱한 숫자만 내뱉습니다.
  • 단점:
    • 이유를 모름: 왜 그걸 결함이라고 했는지 설명하지 못합니다. (검사가 "아, 저건 그림자일 수도 있는데?"라고 물으면 답을 못 합니다.)
    • 실수: 그림자나 노이즈를 진짜 결함으로 착각하는 '환각 (Hallucination)' 현상이 자주 일어납니다.
    • 대화 불가: "이게 얼마나 심각한 거야?"라고 물어보면 대답을 못 합니다.

2. 해결책: INSIGHTX 에이전트의 '3 인조 팀'

이 시스템은 혼자 모든 일을 하는 게 아니라, 세 명의 전문가가 팀을 이루어 일하는 방식입니다.

🕵️‍♂️ 역할 1: '스카우터' (SDMSD - 탐지기)

  • 역할: X-ray 사진 전체를 빠르게 훑어보며 "여기 뭔가 이상해!"라고 후보군을 찾아냅니다.
  • 특징: 아주 작은 구멍이나 빽빽하게 모여 있는 결함도 놓치지 않도록 설계되었습니다. 하지만 이 스카우터는 너무 많은 후보를 잡아서, 가끔은 '아니, 그건 그냥 그림자야'라고 생각할 수도 있는 초보 탐정입니다.

🧠 역할 2: '수석 검사관' (LMM - 대형 멀티모달 모델)

  • 역할: 이 시스템의 두뇌입니다. 스카우터가 찾아온 후보들을 받아서 진짜 결함인지, 가짜인지 심사합니다.
  • 특징: 인간의 언어를 이해하고, 산업 지식 (예: "알루미늄 주조물에서 이런 모양은 기공 결함이다") 을 가지고 있습니다.

🔍 역할 3: '검증 프로세스' (EGR - 증거 기반 반성)

  • 역할: 수석 검사관이 결함이라고 판단하기 전에, 스스로에게 질문을 던지는 과정입니다. 마치 법정에서 변호사가 증거를 재검토하는 것과 같습니다.
    1. 상황 파악: "이 사진이 흐릿하지는 않나?"
    2. 개별 분석: "이 구멍 모양이 진짜 결함 모양과 비슷해?"
    3. 거짓 제거: "아, 이건 금속이 겹쳐서 생긴 그림자구나. (거짓 양성 제거)"
    4. 신뢰도 재조정: "확실하진 않지만, 전문가가 한 번 더 봐야겠어. (불확실함 표시)"
    5. 최종 확인: "이제 결론 내릴게."

3. 결과: 왜 이 시스템이 특별한가?

이 시스템은 스카우터가 찾아낸 것을 검증 프로세스를 통해 수석 검사관이 최종적으로 확정합니다.

  • 정확도 향상: 기존 AI 들보다 **96.54%**라는 매우 높은 정확도를 보여줍니다. (거짓 경보를 줄이고 진짜 결함을 잘 찾아냅니다.)
  • 설명 가능 (Interpretability): 단순히 "결함 있음"이 아니라, **"이곳에 원형의 어두운 부분이 있어서 기공 결함으로 판단했습니다. 하지만 주변 구조와 겹쳐서 확신은 80% 입니다"**라고 이유와 근거를 설명해 줍니다.
  • 대화 가능: 작업자가 "이게 얼마나 위험한 거야?"라고 물어보면, "이 정도 크기와 위치면 주의를 기울여야 하지만, 즉시 폐기할 수준은 아닙니다"라고 자연스럽게 대화할 수 있습니다.

💡 한 줄 요약

INSIGHTX 에이전트는 단순히 X-ray 사진을 보고 "결함 있음"이라고 외치는 기계가 아니라, **스스로 의심하고, 증거를 검토하며, 인간과 대화할 수 있는 '똑똑한 검사관'**입니다.

이 기술은 항공기나 자동차 부품처럼 안전이 생명인 산업 분야에서, AI 가 인간을 대체하는 것이 아니라 인간 검사관의 능력을 극대화하여 더 안전하고 신뢰할 수 있는 결정을 내리게 도와줍니다.