Metriq: A Collaborative Platform for Benchmarking Quantum Computers

本論文は、断片化された量子コンピュータベンチマークの課題を解決するため、オープンソースの協調プラットフォーム「Metriq」を導入し、複数のハードウェアベンダーから得られたデータを統合的に評価する「Metriq スコア」を含む包括的なベンチマーク体系を提案するものです。

Alessandro Cosentino, Changhao Li, Vincent Russo, Bradley A. Chase, Tom Lubinski, Siyuan Niu, Neer Patel, Nathan Shammah, William J. Zeng

公開日 2026-03-10
📖 1 分で読めます🧠 じっくり読む

Each language version is independently generated for its own context, not a direct translation.

メトリック(Metriq):量子コンピュータの「総合テストセンター」

この論文は、**「Metriq(メトリック)」**という新しいプラットフォームについて紹介しています。

簡単に言うと、これは**「量子コンピュータの性能を公平に測るための、オープンな総合テストセンター」**です。

これまでの量子コンピュータのテストは、メーカーごとに独自のルールや道具を使って行われており、まるで「A 社の車のテスト」と「B 社の車のテスト」を同じ基準で比較できないような状態でした。メトリックは、そのバラバラな状況を整理し、誰でも同じ条件で性能を測れるようにする「共通の物差し」と「結果を公開する掲示板」を作りました。

以下に、この仕組みを身近な例えを使って説明します。


1. なぜメトリックが必要なのか?(問題点)

今の量子コンピュータ業界は、**「それぞれが独自のルールでテストしている状態」**です。

  • メーカー A は「自分のマシンは最高だ!」と独自のテスト結果を発表。
  • メーカー B も「うちの方が速い!」と別のテスト結果を主張。

これでは、第三者が「どっちが本当に優れているのか」を判断できません。また、テスト結果がバラバラで、過去のデータと今のデータを比べるのも大変です。

メトリックの役割:
これは、**「すべての選手が同じトラックで、同じルールで走るオリンピック」**のようなものです。誰が主催しても、誰が観客でも、同じ基準で「誰が速いのか」「誰が持久力があるのか」を公平に比較できます。

2. メトリックの仕組み(3 つの柱)

メトリックは、大きく分けて 3 つの部品で構成されています。

① 実行係(Runner / metriq-gym):「テストを走らせるランナー」

  • 役割: 世界中の異なる量子コンピュータ(IBM、Quantinuum、Rigetti など)に対して、同じテストプログラムを自動で走らせるツールです。
  • 例え: 料理のレシピ(テスト手順)を一つ用意し、それを「アメリカのキッチン」「日本のキッチン」「フランスのキッチン」など、異なる設備のキッチンに持ち込んで、**「同じレシピで同じ料理を作らせる」**ようなものです。結果がどうなるか、設備の違いによる影響がはっきりわかります。

② データ集(Dataset / metriq-data):「結果を記録する巨大なノート」

  • 役割: 実行されたテストの結果を、誰でも見られる形で保存・整理します。
  • 例え: 競技会の**「公式記録帳」**です。誰が、いつ、どのマシンで、どんな結果を出したかがすべて記録され、誰でも自由にコピーして分析できます。

③ ウェブサイト(Website / metriq-web):「結果を見せる掲示板」

  • 役割: 記録されたデータをグラフや表にして、誰でも直感的に比較できるように見せてくれます。
  • 例え: 競技会の**「リアルタイム掲示板」**です。ここでは、各マシンの成績が色とりどりのグラフで表示され、「あそこのマシンは速いけど、あそこはエラーが多いな」といった傾向が一目でわかります。

3. 何を実験しているの?(テスト内容)

メトリックでは、単に「速さ」だけでなく、多様な能力を測るテストを行っています。

  • 基礎体力テスト(システムレベル):
    • BSEQ: 量子ビット同士が「もつれ(エンタングルメント)」という不思議な状態を、どれくらい広範囲に作れるか?(例:156 個のビットのうち、何個までが上手につながっているか?)
    • EPLG: 計算の「層(レイヤー)」を積み重ねたとき、どれくらいエラーが溜まるか?(例:積み木を高く積み上げたとき、どれくらい崩れにくい?)
  • 実戦テスト(応用レベル):
    • QML Kernel: 機械学習(AI)の計算を、どれくらい正確にできるか?
    • WIT: 「ワームホール(虫穴)」という物理現象をシミュレーションする複雑な計算を、どれくらい忠実に再現できるか?
    • LR-QAOA: 組み合わせ最適化問題(配送ルートの最適化など)を、どれくらい良い答えで見つけられるか?

4. 「メトリック・スコア」とは?

それぞれのテスト結果を、一つの数字にまとめてランク付けしたものが**「メトリック・スコア」**です。

  • 例え: 大学入試の「総合得点」のようなものです。
    • 数学(BSEQ)が得意なマシン、国語(QML)が得意なマシン、体育(CLOPS/速度)が得意なマシンがいます。
    • メトリック・スコアは、これらを「どの分野を重視するか」という重み付けをして合計し、「総合的にどれくらい優秀か」を 1 つの数字で示します。
    • 基準となるマシン(例:IBM の「Torino」)を 100 点とし、それより良いマシンは 100 点を超え、悪いマシンは 100 点未満になります。

5. このプロジェクトのすごいところ

  • 公平性: メーカーが自分でテストするのではなく、第三者(Unitary Foundation という非営利団体)が運営しています。
  • 透明性: すべてのテストコード、データ、結果は「オープンソース(誰でも見られる状態)」で公開されています。
  • 継続性: 一度きりのテストではなく、マシンの性能が向上したら、また同じテストを繰り返して「成長度」を追跡できます。
  • コスト意識: 量子コンピュータのテストは非常に高価ですが、メトリックは「いかに安くテストするか」も考慮し、誰でも参加できるように工夫しています。

結論:これからどうなる?

メトリックは、量子コンピュータの「成長記録」を記録し続けるための**「生きているプラットフォーム」**です。

ハードウェアが進化し、エラー訂正(故障を直す技術)が実用化される未来に向けて、この「共通の物差し」があれば、研究者も企業も、**「今、技術はどの段階にあるのか」「次に何を改善すべきか」**を客観的に議論できるようになります。

つまり、メトリックは量子コンピュータが「実験室の玩具」から「社会を動かす実用的な機械」へと成長する過程を、公平に支えるための**「信頼できるコンパス」**なのです。