Closing the Loop: Resource-aware Hybrid NAS Guided by Analytical and Hardware-Calibrated Quantum Cost Modeling
이 논문은 실제 양자 하드웨어 보정 데이터를 기반으로 한 분석적 비용 모델과 NSGA-II 를 활용한 하이브리드 신경 아키텍처 탐색 프레임워크 (Hyb-HANAS) 를 제안하여, 양자 - 고전 신경망의 정확도, 하드웨어 비용, 파라미터 수 간의 최적 균형을 찾음과 동시에 NISQ 장치에서의 실제 실행 비용을 정밀하게 예측할 수 있도록 합니다.
원저자:Muhammad Kashif, Alberto Marchisio, Muhammad Shafique
상상해 보세요. 여러분이 **일반적인 벽돌 (고전 컴퓨터)**과 **마법의 수정구슬 (양자 컴퓨터)**을 섞어서 건물을 짓는 건축가라고 칩시다.
기존의 실수: 과거의 건축가들은 건물의 크기를 재기 위해 '벽돌 개수 (FLOPs)'만 세었습니다.
벽돌은 개수를 세면 크기를 알 수 있지만, 마법의 수정구슬은 개수를 세는 것으로 크기를 알 수 없습니다.
수정구슬은 "빛의 속도", "주변의 잡음", "구슬끼리 연결하는 데 걸리는 시간" 등 훨씬 복잡한 요소에 의해 비용이 결정됩니다.
결과: 건축가들은 "벽돌은 적게 썼으니 이 설계는 효율적이야!"라고 착각했지만, 실제로는 마법의 구슬을 쓰는 데 너무 많은 시간과 에너지가 들어가는 비효율적인 건물을 설계하게 되었습니다.
이 논문은 **"벽돌 개수만 세는 건 의미가 없어. 양자 구슬의 진짜 '소모 시간'을 정확히 재야 해!"**라고 말합니다.
2. 해결책: "양자 구슬의 진짜 가격을 계산하는 새로운 계산기"
저자들은 두 가지 새로운 계산기를 만들었습니다.
A. 양자 컴퓨터용 '실시간 가격표' (Analytical Quantum Cost Model)
이 계산기는 양자 컴퓨터가 실제로 작동할 때 걸리는 시간을 예측합니다.
비유: 마치 택시를 탈 때, 단순히 '거리'만 보고 요금을 계산하는 게 아니라, 교통 체증 (라우팅 오버헤드), 차량 고장 확률 (잡음/노이즈), **신호등 대기 시간 (게이트 지연)**까지 모두 고려해서 "정확히 몇 분 걸리고 얼마가 들겠다"고 예측하는 앱과 같습니다.
특징: 이 계산기는 실제 양자 컴퓨터의 최신 상태 데이터 (캘리브레이션) 를 실시간으로 가져와서, "오늘은 그 기계가 좀 느리네, 고장 날 확률이 높네"를 반영합니다.
B. 고전 컴퓨터용 '시간 환산기' (Classical Cost Model)
비유: 벽돌을 쌓는 데 걸리는 '작업량'을 '시간'으로 바꿔주는 변환기입니다.
목적: 벽돌 (고전) 과 구슬 (양자) 의 비용을 모두 **'시간 (초)'**이라는 같은 단위로 통일합니다. 그래야 "벽돌을 10 초에 쌓는 대신 구슬을 5 초에 쓰면 전체적으로 더 빠르다"고 비교할 수 있기 때문입니다.
3. 실행 방법: "AI 가 스스로 건물을 설계하는 과정 (Hyb-HANAS)"
이제 이 새로운 계산기를 이용해 AI 가 자동으로 최고의 건물을 찾아냅니다. 이를 Hyb-HANAS라고 부릅니다.
작동 원리:
AI 는 수많은 설계도 (건축물) 를 무작위로 만들어냅니다.
정확도: 이 건물이 얼마나 잘 작동하는지 봅니다.
비용: 위에서 만든 '새로운 계산기'로 벽돌과 구슬을 쓰는 데 걸리는 총 시간을 계산합니다.
선택: "정확도는 높으면서 비용은 가장 적은" 설계도들만 살아남게 합니다 (파레토 최적화).
진화: 살아남은 설계도들을 섞고 변형시켜 더 좋은 설계도를 만들어냅니다.
결과:
고정 모드: 벽돌 구조는 그대로 두고 구슬 구조만 바꿨을 때, 구슬이 너무 복잡하면 비용이 폭탄처럼 터진다는 것을 발견했습니다.
유동 모드: 벽돌과 구슬을 모두 자유롭게 바꿨을 때, 벽돌이 잘 만들어지면 구슬을 단순하게 해도 되므로 전체 비용이 줄어든다는 놀라운 사실을 발견했습니다. 즉, 두 부분이 서로 도와주는 (Co-adaptation) 관계를 찾은 것입니다.
4. 핵심 메시지: "실제 기계의 성격을 알아야 한다"
이 연구의 가장 큰 공헌은 **"양자 컴퓨터는 아직 완벽하지 않다 (잡음이 있고 연결이 제한적이다)"**는 사실을 설계 단계에서부터 고려했다는 점입니다.
기존: "이론상으로는 이 설계가 최고야!" (실제 기계에서는 실패함)
이 연구: "이 기계는 오늘 컨디션이 안 좋으니, 잡음에 강한 단순한 설계를 골라야 해!" (실제 기계에서도 잘 작동함)
요약
이 논문은 **"양자 컴퓨터와 일반 컴퓨터를 섞어 쓸 때, 기존의 단순한 계산법으로는 진짜 비용을 알 수 없다"**고 지적하며, **"실제 기계의 상태 (잡음, 연결, 속도) 를 반영한 정확한 시간 계산법"**을 개발했습니다. 이를 통해 AI 가 자동으로 정확하면서도 실제 양자 컴퓨터에서 실행 가능한 최적의 설계를 찾아내도록 했습니다.
마치 **"이론상의 비행기 설계도만 보고 날리려 하지 말고, 실제 바람과 기체 상태를 고려한 설계도를 만들어야 실제 하늘을 날 수 있다"**는 교훈을 주는 연구입니다.
1. 문제 정의 (Problem Statement)
하이브리드 양자 - 고전 신경망 (HQNN) 의 자원 추정 난제: HQNN 은 고전 레이어와 양자 회로를 통합하지만, 두 시스템은 근본적으로 다른 계산 패러다임을 가집니다. 이로 인해 하드웨어 자원 추정이 매우 어렵습니다.
FLOPs 기반 평가의 한계: 기존 고전 신경망의 NAS(신경망 구조 탐색) 는 연산 복잡도를 추정하기 위해 FLOPs(Floating Point Operations) 를 주로 사용합니다. 그러나 양자 연산은 텐서 계산이 아니며, 양자 하드웨어의 고유한 특성 (큐비트 연결성, 노이즈, 디코히어런스 등) 에 따라 비용이 결정됩니다.
FLOPs 프로파일링 도구는 양자 레이어를 '블랙박스'로 간주하거나, 시뮬레이터 구현 방식에 따라 실제 양자 하드웨어 비용과 전혀 상관없는 수치를 산출합니다.
예: 일부 시뮬레이터에서는 회로 깊이가 깊어질수록 FLOPs 는 증가하지만, 실제 하드웨어 실행 시간과는 무관하게 일정하게 유지되거나 오히려 실제 비용이 증가함에도 FLOPs 는 변하지 않는 등 불일치가 발생합니다.
NISQ 장치의 훈련 비실용성: 실제 양자 장치 (NISQ) 에서 양자 회로를 훈련시키려면 수천 번의 회로 실행이 필요하여 비효율적이고 비용이 많이 듭니다. 따라서 대부분의 HQNN 은 고전 시뮬레이터에서 평가되며, 이때 FLOPs 나 게이트 수와 같은 단순 지표만 사용되어 실제 하드웨어 비용을 과소평가하거나 왜곡합니다.
피드백 루프 단절: 설계 단계의 아키텍처와 실제 하드웨어 비용 간의 연결이 끊어져, 실제 양자 장치에서 실행 가능한 최적의 구조를 찾기 어렵습니다.
2. 제안된 방법론 (Methodology)
저자들은 이 문제를 해결하기 위해 분석적 양자 비용 모델과 고전 비용 모델을 통합한 **하드웨어 인식 하이브리드 NAS 프레임워크 (Hyb-HANAS)**를 제안했습니다.
A. 분석적 양자 비용 모델 (Analytical Quantum Cost Model)
실제 백엔드 (IBM Quantum 등) 의 교정 데이터를 기반으로 양자 하드웨어의 실제 실행 시간을 추정합니다.
게이트 실행 시간: 단일 큐비트 및 2 큐비트 게이트의 실제 지속 시간 (t1q,t2q) 을 반영합니다.
라우팅 오버헤드: NISQ 장치의 제한된 큐비트 연결성으로 인해 필요한 SWAP 게이트 등 추가 2 큐비트 게이트로 인한 지연 시간을 계산합니다.
노이즈 및 신뢰성 오버헤드: 게이트 오류와 디코히어런스로 인해 유효한 샘플을 얻기 위해 필요한 추가 샷 (shots) 수를 통계적으로 모델링하여 시간 페널티로 변환합니다.
공식: Teff=1−pfailTlogical+Trouting
기울기 평가 비용: 파라미터 시프트 규칙 (Parameter-shift rule) 을 사용하여 양자 회로 훈련 시 필요한 기울기 계산 비용 (파라미터당 2 회 평가) 을 포함합니다.
B. 분석적 고전 비용 모델 (Analytical Classical Cost Modeling)
FLOPs 를 실제 장치의 처리량 (Throughput) 을 통해 시간 단위로 변환합니다.
기준 모델을 통해 측정된 FLOPs/sec (Φdevice) 를 사용하여, 임의의 후보 모델의 FLOPs 를 해당 하드웨어에서의 실행 시간 (Tclassical) 으로 환산합니다.
이를 통해 고전과 양자 비용 모두 **초 (seconds)**라는 통일된 물리 단위로 표현되어 공정한 비교가 가능해집니다.
C. Hyb-HANAS 프레임워크
NSGA-II 기반 다목적 최적화: 정확도 (Accuracy), 총 파라미터 수, 고전 비용 (Tclassical), 양자 비용 (Tquantum) 을 동시에 최적화합니다.
하드웨어 인-더-루프 (Hardware-in-the-loop) 에뮬레이션:
양자 레이어는 효율적인 시뮬레이터 (Adjoint differentiation 등) 에서 훈련되지만, 비용 평가는 실시간 백엔드 교정 데이터를 기반으로 한 분석적 모델을 통해 수행됩니다.
이는 실제 장치를 직접 실행하지 않고도 실제 하드웨어 제약 조건을 반영한 탐색을 가능하게 합니다.
검색 모드:
고정 CNN 모드: 고전 레이어는 고정하고 양자 레이어 구조 (큐비트 수, 깊이, 얽힘 토폴로지 등) 만 최적화.
가변 CNN 모드: 고전 및 양자 레이어를 모두 함께 최적화하여 상호 적응 (Co-adaptation) 을 탐색.
3. 주요 기여 (Key Contributions)
FLOPs 기반 평가의 한계 규명: HQNN 에서 FLOPs 가 실제 양자 하드웨어 비용을 반영하지 못하며, 오히려 시뮬레이션 오버헤드를 반영할 뿐임을 실험적으로 증명했습니다.
하드웨어 교정 기반 분석적 비용 모델 개발: 게이트 지속 시간, 라우팅 오버헤드, 노이즈로 인한 샘플링 비효율성을 통합하여 양자 회로의 실제 훈련 지연 시간을 정밀하게 추정하는 모델을 제시했습니다.
통일된 시간 기반 비용 지표: 고전 (FLOPs 기반) 과 양자 (게이트/노이즈 기반) 비용을 모두 '시간' 단위로 변환하여 하이브리드 시스템의 다목적 최적화를 가능하게 했습니다.
Hyb-HANAS 프레임워크 제안: 제안된 비용 모델을 NSGA-II NAS 에 통합하여, 정확도와 하드웨어 비용 (및 파라미터 수) 간의 파레토 최적 (Pareto-optimal) 트레이드오프를 찾는 시스템을 구축했습니다.
하드웨어 인식 설계 인사이트: 라우팅 오버헤드와 노이즈가 양자 하드웨어 비용의 주된 요인임을 분석하고, 고전 - 양자 구성 요소 간의 상호 적응이 하드웨어 효율성을 높이는 데 중요함을 보였습니다.
4. 실험 결과 (Results)
모델 검증: 제안된 분석적 모델이 IBM Qiskit 스케줄러의 예상 실행 시간과 높은 일치도를 보였으며, 노이즈 보정까지 포함하여 실제 하드웨어 비용을 더 정확하게 반영함을 확인했습니다.
고정 CNN 모드 결과:
고전 레이어가 고정된 상태에서 양자 레이어만 최적화했을 때, 얕고 효율적인 양자 회로도 깊은 회로와 유사한 정확도를 달성할 수 있음을 보였습니다.
깊은 회로일수록 라우팅 오버헤드와 신뢰성 페널티 (노이즈) 가 급격히 증가하여 비용이 비효율적이 됨을 확인했습니다.
가변 CNN 모드 결과:
고전과 양자 레이어를 함께 최적화했을 때 더 풍부한 파레토 프론트가 형성되었습니다.
상호 적응 (Co-adaptation): 고전 CNN 이 복잡해지면 (깊은 레이어, 많은 채널), Hyb-HANAS 는 더 단순하고 얕은 양자 회로를 선택하여 전체 비용을 줄였습니다. 반대로 고전 부분이 단순할 때는 더 표현력이 풍부한 양자 회로를 선택하여 정확도를 유지했습니다.
비용 분해 분석 (Ablation Study):
회로 복잡도가 증가함에 따라 라우팅 오버헤드와 신뢰성 페널티가 양자 하드웨어 비용의 지배적인 요인임을 확인했습니다.
이는 HQNN 설계 시 단순한 게이트 수 감소뿐만 아니라, 연결성 제약과 노이즈를 고려한 컴팩트한 구조가 필수적임을 시사합니다.
5. 의의 및 결론 (Significance)
실용적인 HQNN 설계 가이드: 실제 양자 하드웨어의 물리적 제약 (노이즈, 연결성) 을 고려하지 않은 추상적인 NAS 를 넘어, 실제 장치에서 실행 가능한 효율적인 하이브리드 아키텍처를 설계할 수 있는 방법을 제시했습니다.
비용 효율적인 탐색: 실제 양자 장치를 직접 실행하지 않고도 분석적 모델을 통해 정확한 비용 추정이 가능하므로, NISQ 장치의 제한된 자원을 효율적으로 활용할 수 있습니다.
확장성: 제안된 분석적 비용 모델은 양자 회로 컴파일러 평가, 하드웨어 선택, 알고리즘의 충실도 - 지연 시간 트레이드오프 분석, 그리고 NISQ 장치에서의 훈련 시간 추정 등 다양한 양자 컴퓨팅 분야에 적용 가능합니다.
이 논문은 양자 - 고전 하이브리드 시스템의 설계와 최적화에 있어 '하드웨어 인식 (Hardware-aware)' 접근법의 중요성을 강조하며, 이론적 모델과 실제 하드웨어 데이터 간의 간극을 메우는 중요한 기여를 했습니다.