TigerVector: Supporting Vector Search in Graph Databases for Advanced RAGs

本論文は、TigerGraph にベクトル検索機能を統合し、構造化データと非構造化データの融合を可能にする新しいシステム「TigerVector」のアーキテクチャ、GSQL による拡張、および他システムとの比較実験を通じて示された優れた性能について述べています。

Shige Liu, Zhifang Zeng, Li Chen, Adil Ainihaer, Arun Ramasami, Songting Chen, Yu Xu, Mingxi Wu, Jianguo Wang

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🐯 タイガーベクター:グラフデータベースに「AI の直感」を融合させる新システム

この論文は、**「TigerVector(タイガーベクター)」**という新しいシステムについて紹介しています。これは、複雑なデータ関係を管理する「グラフデータベース」と、AI が意味を理解するための「ベクター検索」を、一つのシステムの中で完璧に組み合わせた画期的な技術です。

まるで、**「図書館の整理係(グラフ)」「天才的な読書家(AI/ベクター)」**を一人の人物に融合させたようなものです。

以下に、専門用語を避け、身近な例えを使って解説します。


1. なぜこれが必要なの?(背景)

現在、AI(大規模言語モデル)に質問する際、**「RAG(検索拡張生成)」**という技術が使われています。これは、AI に「あなたの知識だけでなく、外部のデータも調べてから答えてね」と指示する仕組みです。

  • これまでの課題:
    • 多くのシステムは、「ベクター検索」(意味の近いものを探す)か、「グラフ検索」(関係性をたどる)のどちらかしかできません。
    • 例え話:
      • ベクター検索だけ: 「『美味しいラーメン』に近い言葉」を探すのは得意ですが、「そのラーメン屋が『A さんの友達』で、『B さんの店』から『C さん』に紹介された」という複雑なつながりを理解できません。
      • グラフ検索だけ: 関係性は完璧ですが、「『美味しい』という感覚」や「文章のニュアンス」を AI が理解して検索するのは苦手です。

これでは、AI が「正解」を見つけるのに何度も試行錯誤してしまい、時間とコストがかさみます。

2. TigerVector の解決策:「二刀流」のスーパーデータベース

TigerVector は、「ベクター検索」と「グラフ検索」を一つのシステムで同時に行えるようにしました。

  • イメージ:
    • 従来のシステムは、「ベクター検索専門の図書館」と「グラフ検索専門の図書館」が別々にあり、データを運ぶためにバス(データ移動)を使わなければなりませんでした。
    • TigerVectorは、**「超巨大な複合施設」**を作りました。ここでは、意味の近い本(ベクター)と、本同士の複雑な関係図(グラフ)が、同じ棚に並んでいます。

3. どのようにして実現したのか?(3 つの工夫)

① 「ベクター」という新しい属性の追加

従来のグラフデータベースでは、データは「名前」「年齢」などの単純な値でした。TigerVector は、これに**「ベクター(AI が理解する意味のベクトル)」**という新しい属性を追加しました。

  • 例え: 人物カードに「名前」や「住所」を書く欄があったところに、**「その人の思考の匂い」「文章の雰囲気」**を記録する新しい欄が追加されたようなものです。

② 別々の倉庫で管理(デカップリング)

ベクターデータは非常に重く、普通のデータとは性質が異なります。TigerVector は、「普通のデータ」と「ベクターデータ」を物理的に別の倉庫(ストレージ)に保管しつつ、ID でつなぎ合わせています。

  • メリット: ベクター検索専用の「高速な索引(HNSW)」を使えるため、「専門のベクターデータベース(Milvus など)」と同等の速さを維持できます。また、一方を更新しても他方に影響を与えません。

③ 並列処理の力(MPP アーキテクチャ)

TigerVector は、データを何千もの小さな断片(セグメント)に分け、複数のコンピューターで同時に処理する「MPP(大規模並列処理)」技術を使っています。

  • イメージ: 1 億冊の本を検索する際、1 人の人が全部探すのではなく、1000 人の探偵チームがそれぞれ担当区域を分担して、一瞬で結果を集約するような仕組みです。

4. 何がすごいのか?(具体的な機能)

TigerVector には、GSQLという独自のクエリ言語が搭載されており、以下のような複雑な検索が「一言」でできます。

  • フィルタ付きベクター検索:

    • 「『美味しい』という雰囲気(ベクター)で、かつ『東京にあり』かつ『A さんの友達』が書いたレビュー」を探す。
    • これまでなら「ベクター検索」→「結果をフィルタ」→「グラフ検索」→「再フィルタ」という手順が必要でしたが、TigerVector なら一発で完了します。
  • グラフ上での類似検索:

    • 「A さんの友達」→「その友達の友達」→「その友達の投稿」という道筋をたどりながら、**「どの投稿が一番『AI について』に近い内容か」**を瞬時に見つけます。
    • これは、**「コミュニティ(グループ)ごとに、そのグループの雰囲気に合った投稿を探す」**といった、高度な分析を可能にします。

5. 性能はどれくらい?(実験結果)

論文では、既存のシステムと激しい競争を行いました。

  • Neo4j や Amazon Neptune(他のグラフ DB)と比較:
    • 速度:4〜5 倍 速い。
    • 精度:20〜25% 高い正解率。
    • コスト: 高性能なクラウド機器を使っている相手に対し、TigerVector は22 倍も安いハードウェアで同等以上の性能を出しました。
  • Milvus(ベクター検索の専門家)と比較:
    • 専門家に引けを取らない、むしろそれ以上の速度を記録しました。

6. まとめ:未来の AI は「つながり」と「意味」の両方を知る

TigerVector は、**「データの意味(ベクター)」「データの関係(グラフ)」**を分断せず、一つに統合しました。

  • これまでの世界: 意味を探す AI と、関係を探すシステムが手を取り合えず、データの行き来で疲弊していた。
  • TigerVector の世界: 両方の能力を兼ね備えた「スーパー探偵」が、「意味の近さ」と「関係の深さ」を同時に考慮して、最も適切な答えを瞬時に見つけ出す。

この技術は、2024 年 12 月にリリースされた「TigerGraph v4.2」に組み込まれており、より賢く、高速で、安価な AI アプリケーションの実現を可能にします。


一言で言うと:
「ベクター検索の速さ」と「グラフ検索の深さ」を、**「一つのシステムで、専門家に負けない速さ」**で実現した、AI 時代の最強のデータ検索エンジンです。