Benchmarking Variational Quantum Algorithms for Combinatorial Optimization in Practice
이 논문은 Max-Cut 문제를 벤치마크로 활용하여 제한된 자원을 가진 실제 환경에서 변분 양자 알고리즘이 샘플링 및 탐욕 알고리즘보다 언제 일관되게 우월한지, 그리고 문제 크기에 따른 성능 차이를 수치적으로 분석함으로써 변분 양자 알고리즘의 실용적 벤치마킹을 위한 통찰을 제공합니다.
원저자:Tim Schwägerl, Yahui Chai, Tobias Hartung, Karl Jansen, Stefan Kühn
우리가 살면서 겪는 많은 문제 (물류 최적화, 칩 설계 등) 는 **'조합 최적화 문제'**라고 불립니다. 이는 "수많은 가능성 중에서 가장 좋은 답을 찾아내는 것"을 의미하죠.
고전 컴퓨터 (기존 컴퓨터): 이 문제를 풀 때 똑똑한 '탐색자'가 되어 규칙을 따르며 답을 찾습니다.
양자 컴퓨터: 확률의 세계를 이용해 여러 답을 동시에 탐색하는 '요술쟁이'처럼 작동합니다.
하지만 문제는 현재 양자 컴퓨터는 아직 완벽하지 않다는 점입니다. 잡음 (노이즈) 이 많고, 깊은 계산을 못 합니다. 그래서 과학자들은 **"얕은 회로 (간단한 계산)"**만 사용하는 새로운 방식인 **변분 양자 알고리즘 (VQA)**을 개발했습니다.
🧪 2. 실험 설정: "세 명의 경쟁자"
연구팀은 이 새로운 양자 알고리즘이 정말 유용한지 확인하기 위해, **'최대 컷 (Max-Cut)'**이라는 퍼즐 문제를 가지고 세 명의 경쟁자를 붙였습니다.
양자 알고리즘 (VQE): 양자 컴퓨터의 '요술쟁이'. 초기 설정에 따라 운이 좋으면 좋은 답을 찾지만, 훈련 (학습) 에 많은 시간이 걸립니다.
무작위 추측 (샘플링): "눈을 감고 주사위를 던져 답을 고르는 사람". 전혀 지능이 없지만, 아주 간단한 문제에서는 운이 좋으면 정답에 가까울 수도 있습니다.
탐욕스러운 알고리즘 (Greedy): "한 번에 한 걸음씩 가장 좋은 방향으로만 가는 사람". 규칙이 명확해서 빠르고 안정적입니다.
중요한 점: 이 세 명은 **같은 출발점 (초기 상태)**에서 시작했습니다. 양자 알고리즘이 "어디서 시작했는지"가 성능에 큰 영향을 주기 때문입니다.
📊 3. 연구 결과: "크기에 따라 달라지는 운명"
연구팀은 문제의 크기 (정점의 수) 를 작게 시작해서 점점 크게 해가며 실험했습니다. 결과는 매우 흥미로웠습니다.
🐣 작은 문제 (문제 크기 11~21): "양자 컴퓨터는 무작위 추측보다도 못 해!"
상황: 문제가 너무 작으면, 그냥 눈을 감고 무작위로 답을 고르는 것 (샘플링) 이 오히려 더 잘 맞습니다.
비유: 10 개의 상자 중 하나에 보물이 숨겨져 있을 때, 양자 컴퓨터가 복잡한 계산을 하며 보물을 찾으려 노력하는 동안, 무작위로 상자 하나를 열어보는 사람이 이미 보물을 찾아낸 상황입니다.
결론: 작은 문제에서는 양자 알고리즘이 훈련하는 데 드는 시간과 자원만 낭비할 뿐, 성능이 떨어집니다.
🌳 중간 크기 문제 (문제 크기 31 이상): "양자 컴퓨터의 반격 시작"
상황: 문제가 커지면 무작위 추측은 실패 확률이 너무 높아져서 쓸모가 없어집니다. 이때 양자 알고리즘이 비로소 빛을 발하기 시작합니다.
비유: 보물이 숨겨진 상자가 100 만 개로 늘어났다면, 무작위로 찾는 것은 불가능에 가깝습니다. 하지만 양자 알고리즘은 "어디에 보물이 있을지 확률적으로 감을 잡는" 능력을 발휘하여, 무작위 추측보다 훨씬 좋은 답을 찾습니다.
결론:약 30 개 이상의 변수가 있는 문제부터 양자 알고리즘이 무작위 추측을 압도하기 시작했습니다.
🏃♂️ 탐욕스러운 알고리즘과의 대결: "초반은 인간이 이기고, 후반은 양자가 이긴다"
초반: '탐욕스러운 알고리즘'은 규칙대로 빠르게 움직여서 초반에 좋은 답을 찾아냅니다. 양자 알고리즘은 아직 학습 중이라 뒤처집니다.
후반: 시간이 지나면 양자 알고리즘은 더 깊은 곳 (더 좋은 해답) 을 찾아내며, 결국 '탐욕스러운 알고리즘'이 멈춘 곳보다 더 좋은 답을 찾습니다.
한계: 하지만 문제가 너무 커지면 (60 개 이상), 양자 알고리즘이 이기는 '마진 (차이)'은 점점 줄어듭니다.
🔍 4. 중요한 발견: "시작점이 같아도 결과는 다르다"
연구팀은 흥미로운 사실을 발견했습니다.
양자 알고리즘에게 "이곳에서 시작해!"라고 하면 좋은 답을 찾는 경우가 많았습니다.
그런데 동일한 시작점에서 '탐욕스러운 알고리즘'을 실행시켰을 때는, 그 시작점이 나쁜 경우가 많았습니다.
비유: 양자 알고리즘은 "산등성이의 어느 지점에서 시작하면 정상에 가장 빨리 오를 수 있는지"를 잘 알고 있지만, 탐욕스러운 알고리즘은 "그 지점에서 바로 옆으로만 이동"하는 방식이라 오히려 함정에 빠질 수 있다는 뜻입니다.
💡 5. 결론 및 시사점: "양자 컴퓨터는 언제 쓸모가 있을까?"
이 논문은 우리에게 다음과 같은 교훈을 줍니다.
작은 문제에서는 양자 컴퓨터가 쓸모없다: 현재 기술로는 작은 문제를 풀 때 양자 컴퓨터가 고전 컴퓨터나 무작위 추측보다 낫지 않습니다.
적당한 크기의 문제가 필요하다: 양자 알고리즘이 빛을 발하려면 최소 30 개 이상의 변수가 있는 복잡한 문제가 필요합니다.
현실적인 기대: 양자 컴퓨터가 모든 문제를 해결하는 마법 지팡이는 아닙니다. 특정 조건 (문제 크기, 자원) 에서만 고전 알고리즘을 이길 수 있습니다.
한 줄 요약:
"양자 컴퓨터는 아직 어린아이처럼 작은 문제에서는 엉뚱한 답을 내놓지만, 문제가 충분히 커지고 복잡해지면 그 특유의 '확률적 직관'으로 고전 컴퓨터가 도달하지 못하는 곳까지 도달할 수 있는 잠재력을 가지고 있습니다. 하지만 그 잠재력을 발휘하려면 적절한 크기의 문제가 필요합니다."
이 연구는 양자 컴퓨터의 미래를 꿈꾸는 우리에게 **"지금 당장 모든 문제를 양자 컴퓨터에 맡겨서는 안 되며, 어떤 문제부터 시작해야 하는지"**에 대한 현실적인 지도를 그려준 셈입니다.
논문 요약: 실용적 관점에서의 변분 양자 알고리즘 벤치마킹
1. 연구 배경 및 문제 정의 (Problem)
배경: 변분 양자 알고리즘 (VQA), 특히 변분 양자 고유값 솔버 (VQE) 의 변형들은 조합 최적화 (CO) 문제를 해결하기 위해 제안되었습니다. 이러한 접근법은 현재의 잡음이 있는 중규모 양자 (NISQ) 하드웨어에 적합한 얕은 회로 (shallow circuits) 를 사용합니다.
문제: 이론적으로 VQA 는 유망하지만, 실제로 얕은 변분 양자 회로를 훈련하는 데 필요한 리소스 (샘플 수 등) 는 문제 크기에 따라 초다항식 (superpolynomial) 적으로 증가하는 것으로 알려져 있습니다.
핵심 질문: 이러한 "초다항식 스케일링"이 실제 조합 최적화 문제 해결에 어떤 의미를 갖는지, 그리고 고정된 리소스 하에서 VQA 가 기존 고전 알고리즘이나 단순 무작위 샘플링보다 우월한 성능을 발휘할 수 있는지 여부는 명확하지 않습니다.
벤치마크 대상: 본 연구는 대표적인 조합 최적화 문제인 Max-Cut 문제를 사용하여 3-정규 그래프 (3-regular graphs) 의 작은 인스턴스들을 대상으로 수치적 조사를 수행합니다.
2. 방법론 (Methodology)
연구진은 고정된 리소스 (총 목적 함수 평가 횟수 Nevals=106) 하에서 다음 세 가지 알고리즘의 평균 성능을 비교했습니다.
변분 양자 고유값 솔버 (VQE):
회로 구조: 하드웨어 효율적인 얕은 회로 사용. 초기 ∣0⟩ 상태에서 시작하여 단일 층의 파라미터화된 $RY$ 회전 게이트와 벽돌 모양 (brick-like) 의 CNOT 게이트로 구성된 얕은 회로를 사용합니다.
비용 함수: 조합 최적화 성능 향상을 위해 제안된 CVaR (Conditional Value at Risk) 비용 함수를 사용하며, 상위 10% (γ=0.1) 의 결과만 고려합니다.
최적화: 기울기 없는 COBYLA 알고리즘을 사용하여 파라미터를 업데이트합니다.
초기화: VQE 의 초기 파라미터를 사용하여 양자 회로를 한 번 실행하여 얻은 계산 기저 상태 (computational basis state) 를 Greedy 알고리즘의 초기점으로 동일하게 설정하여 공정한 비교를 시도했습니다.
대체 샘플링 (Sampling with replacement):
문제의 구조를 전혀 활용하지 않고, 계산 기저 상태를 무작위로 균일하게 샘플링하는 가장 단순한 방법입니다.
VQE 가 단순히 무작위 추측을 하고 있는지 확인하기 위한 기준선 (baseline) 으로 사용됩니다.
Greedy 알고리즘:
현재 상태에서 비트 1 개를 뒤집었을 때 목적 함수가 가장 크게 개선되는 상태로 이동하는 고전적 휴리스틱 알고리즘입니다.
VQE 와 동일한 초기 상태에서 시작하여, VQE 가 초기화하는 상태가 Greedy 알고리즘에게도 좋은 시작점인지 분석합니다.
성능 지표:
근사 비율 (Approximation Ratio): 찾은 해의 목적 함수 값과 최적 해 (Gurobi 솔버로 구함) 의 비율.
성공 확률: 정확한 해를 찾은 실행 비율 (작은 문제의 경우).
상관 분석: 인스턴스별 (instance-by-instance) 로 알고리즘 간 성능의 상관관계를 분석하기 위해 이진화된 통계 (binned statistics) 를 사용했습니다.
3. 주요 결과 (Key Results)
작은 문제 크기 (N=11, 21):
VQE 는 무작위 샘플링보다 성능이 더 나빴습니다.
특히 N=11의 경우, VQE 가 높은 근사 비율을 보였으나 이는 단순히 문제 공간이 작아 무작위 샘플링으로도 쉽게 좋은 해를 찾기 때문이었으며, VQE 는 오히려 샘플링보다 못한 결과를 보였습니다.
N=21에서도 초기 몇 단계 외에는 VQE 가 Greedy 알고리즘 및 샘플링보다 열등했습니다.
중간 크기 문제 (N > 30):
샘플링 대비 우위: 문제 크기가 30 을 넘어서면 계산 기저 상태의 수가 기하급수적으로 증가하여 무작위 샘플링의 성능이 급격히 떨어집니다. 이때 VQE 는 샘플링보다 일관되게 우수한 성능을 보였습니다 (예: N=31에서 약 95% 의 인스턴스에서 우위).
Greedy 알고리즘 대비 우위:
Greedy 알고리즘은 매우 빠르게 지역 최적점 (local minima) 에 수렴합니다.
VQE 는 초기에는 Greedy 알고리즘보다 성능이 낮았으나, 반복이 진행됨에 따라 더 나은 지역 최적점으로 수렴하여 결국 Greedy 알고리즘을 능가했습니다.
VQE 가 Greedy 알고리즘의 성능을 추월하는 데 필요한 반복 횟수는 문제 크기가 커질수록 증가했습니다 (N=31: 약 100 회, N=61: 약 600 회).
성능 차이의 경향성:
샘플링 대비: 문제 크기가 커질수록 VQE 의 우위가 증가했습니다 (N=61에서 평균 근사 비율 차이 약 0.11).
Greedy 알고리즘 대비: 문제 크기가 커질수록 VQE 의 우위는 오히려 감소했습니다 (N=31에서 최대 차이 약 0.025, N=61에서 약 0.005). 이는 Greedy 알고리즘이 큰 문제에서도 일정한 평균 성능을 유지하는 반면, VQE 의 훈련 난이도가 증가하기 때문입니다.
상관성 분석:
VQE vs 샘플링: 약한 상관관계가 관찰되었으며, 이는 샘플링이 VQE 의 핵심 구성 요소이기 때문입니다.
VQE vs Greedy: 두 알고리즘 간에는 전혀 상관관계가 없었습니다. 이는 VQE 와 Greedy 알고리즘이 근본적으로 다른 메커니즘을 사용하며, VQE 에게 좋은 초기점이 Greedy 알고리즘에게도 좋은 초기점이 아님을 의미합니다.
4. 기여 및 의의 (Contributions & Significance)
실용적 벤치마킹의 중요성 강조:
많은 VQA 연구가 "원리 증명 (proof-of-principle)" 수준에 머무르거나, 고전 솔버가 쉽게 해결할 수 있는 매우 작은 문제를 다룹니다. 본 연구는 고정된 리소스 하에서 실제적인 비교를 통해, VQA 가 유의미한 우위를 보이기 위해서는 문제 크기가 일정 수준 (약 30 변수 이상) 이상이어야 함을 입증했습니다.
샘플링에 대한 엄격한 비교:
VQA 가 단순히 무작위 추측보다 나을지조차 확인되지 않는 작은 문제 영역에서는 VQA 의 성능이 오히려 떨어질 수 있음을 보여주었습니다. 이는 NISQ 시대의 알고리즘 평가에 있어 샘플링을 강력한 베이스라인으로 삼아야 함을 시사합니다.
초기화 전략에 대한 통찰:
VQE 의 초기 파라미터가 생성한 상태가 Greedy 알고리즘의 초기점으로 사용되었을 때, 두 알고리즘의 성능이 서로 예측할 수 없음을 보였습니다. 이는 VQA 의 초기화 (Warm start) 전략이 고전 알고리즘의 관점과는 완전히 다를 수 있음을 의미합니다.
향후 연구 방향 제시:
물리 시스템 (예: 기저 상태 에너지 계산) 에 적용되는 VQA 들은 조합 최적화와 달리 계산 기저 상태가 해가 아닌 경우가 많습니다. 본 연구의 벤치마킹 프레임워크가 Markov Chain Monte Carlo (MCMC) 와 같은 고전적 방법과 비교하여 물리 문제 해결에 어떻게 확장될 수 있는지에 대한 논의도 포함하고 있습니다.
결론
이 논문은 얕은 회로를 사용하는 VQE 가 조합 최적화 문제에서 실제로 유효한지 여부를 정량적으로 분석했습니다. 그 결과, 작은 문제에서는 VQA 가 무작위 샘플링이나 간단한 Greedy 알고리즘보다 열등할 수 있으며, 유의미한 이점을 얻으려면 문제 크기가 충분히 커져야 함을 보여주었습니다. 이는 NISQ 시대의 양자 알고리즘 개발과 평가에 있어 현실적인 자원 제약과 문제 크기를 고려한 신중한 접근이 필요함을 강조합니다.