CircuitSense: A Hierarchical MLLM Benchmark Bridging Visual Comprehension and Symbolic Reasoning in Engineering Design Process

본 논문은 엔지니어링 설계의 계층적 추상화 과정을 평가하기 위해 8,006 개 이상의 문제로 구성된 'CircuitSense' 벤치마크를 제안하며, 시각적 인식과 기호적 추론 간의 심각한 격차를 규명하고 공학적 역량 평가에서 기호적 추론의 핵심적 역할을 강조합니다.

Arman Akbari, Jian Gao, Yifei Zou, Mei Yang, Jinru Duan, Dmitrii Torbunov, Yanzhi Wang, Yihui Ren, Xuan Zhang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 핵심 비유: "레고 조립 설명서" vs "수학 공식"

생각해 보세요. 여러분이 레고를 조립할 때 설명서 (회로도) 를 보고 부품을 찾는 것은 쉽습니다. "여기에 빨간색 블록이 있고, 저기에 파란색 블록이 있구나"라고 말하는 건 AI 도 잘합니다.

하지만 이 논문이 말하려는 것은 다릅니다.

"설명서를 보고 이 레고 구조물이 왜 이렇게 움직이는지, 어떤 물리 법칙 (수학 공식) 을 따르는지 설명해 줄 수 있니?"

지금까지의 AI 는 설명서 (그림) 를 보고 부품을 찾는 것 (Perception) 은 85% 이상 잘하지만, **왜 그렇게 작동하는지 수학적 원리를 도출하는 것 (Symbolic Reasoning)**은 19% 미만에 그칩니다. 마치 레고 조립은 잘하는데, 그 기계가 어떻게 에너지를 변환하는지 물리 공식을 써내지 못하는 것과 같습니다.

2. CircuitSense 란 무엇인가? (새로운 시험지)

연구팀이 만든 CircuitSense는 AI 의 회로 이해 능력을 3 단계로 시험합니다.

  1. 눈 (Perception): "이 그림에 저항이 몇 개 있고, 트랜지스터는 어디에 있니?" (그림을 보는 능력)
  2. 머리 (Analysis): "이 회로의 입력과 출력 관계를 수식으로 표현해 봐." (그림을 수학으로 번역하는 능력)
  3. 손 (Design): "이 성능을 내는 회로를 직접 설계해 봐." (수식을 바탕으로 새로운 것을 만드는 능력)

이 시험지는 8,000 개가 넘는 문제로 구성되어 있으며, 단순한 부품 나열부터 복잡한 시스템 전체의 블록도까지 다양한 난이도로 이루어져 있습니다.

3. 주요 발견: AI 의 '눈'은 밝지만 '두뇌'는 약하다

연구팀은 최신 AI 모델 8 개를 이 시험지에 풀어보게 했습니다. 결과는 놀라웠습니다.

  • 눈 (그림 보기): AI 는 그림을 아주 잘 봅니다. "여기에 커패시터가 있네"라고 90% 이상 정확히 맞춥니다.
  • 두뇌 (수학 풀기): 하지만 그림을 보고 "이 회로의 전압 이득 공식은 A=R2R1A = \frac{R2}{R1}이야"라고 유도해 내기는 거의 실패합니다.
    • 마치 번역기가 단어는 잘 맞추는데, 문장의 논리적 흐름이나 숨은 의미를 전혀 못 알아채는 것과 비슷합니다.
    • 특히, AI 는 이전에 본 문제의 답을 외워서 맞추는 것 (패턴 매칭) 은 잘하지만, 처음 보는 새로운 회로를 보고 수식을 직접 만들어내는 능력은 매우 부족합니다.

4. 왜 이것이 중요한가? (엔지니어링의 핵심)

전기 공학에서 회로 도면은 단순한 그림이 아닙니다. 그것은 수학적 언어로 쓰인 설계도입니다.

  • 비유: 건축가가 건물의 그림을 보고 "이 기둥이 무너지지 않으려면 얼마나 두꺼워야 할지" 계산하는 것과 같습니다.
  • 문제점: 지금의 AI 는 그림을 보고 "아, 이 기둥이 있네"라고 말은 하지만, **"이 기둥이 무너지면 전체 건물이 어떻게 붕괴될지"**를 수학적으로 예측하지 못합니다.
  • 결과: AI 가 진정한 엔지니어링 도구가 되려면, 단순히 그림을 인식하는 것을 넘어 수학적 추론 (Symbolic Reasoning) 능력을 갖춰야 합니다. 이 논문은 바로 그 '결핍된 능력'을 측정하고 개선 방향을 제시합니다.

5. 결론: AI 는 아직 '수학자'가 아니다

이 논문의 결론은 명확합니다.

"AI 는 그림을 보는 은 이미 프로급이지만, 공학적 문제를 해결하는 수학적 두뇌는 아직 초보 수준이다."

AI 가 진정한 엔지니어링 파트너가 되려면, 단순히 "이게 뭐야?"라고 대답하는 것을 넘어, "왜 이렇게 작동하고, 어떻게 계산되는지"를 스스로 증명할 수 있어야 합니다. CircuitSense 는 바로 그 능력을 검증하기 위한 첫걸음입니다.


한 줄 요약:
"AI 는 전기 회로 그림을 잘 보고 부품을 찾아내지만, 그 그림을 보고 수학 공식으로 설명하는 능력은 아직 매우 부족하다는 것을 밝혀낸 새로운 연구입니다."