Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

本論文は、構造化データと非構造化ドキュメントを融合したハイブリッドデータレイクにおける自然言語質問応答の課題を解決するため、クエリを有向非巡回グラフ(DAG)実行計画に変換し、マルチホップ推論と並列処理を可能にする「A.DOT Planner」というエージェント型フレームワークを提案し、その有効性を示したものである。

Kirushikesh D B, Manish Kesarwani, Nishtha Madaan, Sameep Mehta, Aldrin Dennis, Siddarth Ajay, Rakesh B R, Renu Rajagopal, Sudheesh Kairali

公開日 2026-03-17
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「A.DOT(エー・ドット)」**という新しい AI システムについて紹介しています。

一言で言うと、**「会社の膨大なデータ(表形式の数字と、文章や契約書などの文書)を、人間が自然な言葉で質問したときに、正しく、速く、そして『どこから答えが出たのか』を証明しながら答えるための、超優秀な『プロジェクトマネージャー』」**です。

専門用語を抜きにして、わかりやすい例え話で解説しますね。


1. 従来のシステムの問題点:「力任せの探偵」

昔のシステム(RAG など)は、質問を受けると**「力任せに全データを漁る探偵」**のような動きをしていました。

  • 例え話:
    「テキサス州の顧客の請求書合計と、その支払い条件を教えて」と聞かれたとき、従来のシステムは:
    1. 請求書のリスト(表)を全部読み込んで、テキサス州のものを無理やり探そうとする。
    2. 契約書(文章)も全部読み込んで、支払い条件を探そうとする。
    3. 両方の結果を無理やり混ぜ合わせて答えを作る。

ここでの問題点:

  • 非効率: 関係ないデータまで全部読み込むので時間がかかる。
  • 漏洩リスク: 関係ない人の情報まで見せてしまう(セキュリティリスク)。
  • 論理の欠如: 「A から B を知り、その B を使って C を探す」といった、**一歩ずつ考える(多段推論)**のが苦手です。

2. A.DOT の仕組み:「完璧なプロジェクトマネージャー」

A.DOT は、ただ探偵をするのではなく、**「頭脳明晰なプロジェクトマネージャー(PM)」**として働きます。

① 計画を立てる(DAG プランナー)

質問を受けると、いきなり検索を始めるのではなく、まず**「作業手順書(DAG:有向非巡回グラフ)」**を作ります。

  • 例え話:
    「テキサスの請求書合計」を計算するには「まず表からテキサスの行を抜き出す(ステップ A)」「その合計を計算する(ステップ B)」。「支払い条件」は「ステップ A で見つかった請求書番号を使って、契約書から該当ページを探す(ステップ C)」……というように、必要な手順だけを順序立てて図解します。
  • メリット: 無駄な作業を省き、並行してできる作業(A と C など)は同時に進めます。

② 計画のチェック(バリデーター)

実行する前に、「その手順、本当にうまくいく?」と厳しくチェックします。

  • 例え話:
    「あ、待てよ。この手順では『請求書番号』がまだ決まっていないのに、契約書を探そうとしているぞ?それじゃ失敗する!」と、実行前にミスを発見して修正します。

③ トラブル対応(DataOps システム)

もし実行中にエラーが起きても、**「即座に修理する技術者」**が待機しています。

  • 例え話:
    「SQL(データベース)でエラーが出た!」「あ、変数名が間違っていたね。直そう」「それじゃ、別の方法で探そう」と、失敗したらすぐに計画を修正して再挑戦します。これにより、一度の失敗で全体が止まることがありません。

④ 証拠の保存(トレーサビリティ)

答えを出すとき、「どこからこの情報を持ってきたか」をすべて記録します。

  • 例え話:
    「答えは 100 万円です」だけでなく、「この 100 万円は、2023 年 5 月の請求書リストの 3 行目と、契約書の 15 ページ目から導き出されました」と、出所(証拠)を明記して提出します。これなら、誰が見ても「なるほど、嘘じゃないな」と納得できます。

3. なぜこれがすごいのか?(実験結果)

このシステムをテストしたところ、従来の「力任せの探偵」や「他の AI 手法」よりも、正解率と情報の網羅性が大幅に向上しました。

  • 正解率: 約 15% 向上
  • 情報の抜け漏れ: 約 11% 減少

特に、「表(数字)」と「文書(文章)」を行き来して、複雑な答えを導き出すという難しいタスクで、他のシステムが失敗するところを、A.DOT は見事に成功させました。


4. まとめ:未来のオフィス助手

A.DOT は、単なる「検索エンジン」ではなく、「会社のデータ湖(Hybrid Data Lakes)」という巨大で複雑な倉庫を、人間が自然な言葉で質問したときに、

  1. 無駄なく(必要なものだけ取る)、
  2. 論理的に(一歩ずつ考え、並行処理する)、
  3. 安全に(エラーを直して、証拠を残す)、

**答えを導き出す「賢いアシスタント」**です。

現在は IBM の「Watsonx.data」という製品に組み込まれる予定で、企業での実用化が間近に迫っています。これからの AI は、ただ「答える」だけでなく、「どうやって答えたかを説明し、失敗しても自分で直せる」ような、より大人で頼れる存在になっていくのです。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →