TURA: Tool-Augmented Unified Retrieval Agent for AI Search
この論文は、静的なコンテンツと動的なリアルタイム情報の両方にアクセスできる世界クラスの AI 検索製品を実現するため、RAG とエージェント型ツール利用を統合した 3 段階のフレームワーク「TURA」を提案し、大規模産業システムにおける低遅延かつ堅牢な回答を提供する手法を述べています。
154 件の論文
この論文は、静的なコンテンツと動的なリアルタイム情報の両方にアクセスできる世界クラスの AI 検索製品を実現するため、RAG とエージェント型ツール利用を統合した 3 段階のフレームワーク「TURA」を提案し、大規模産業システムにおける低遅延かつ堅牢な回答を提供する手法を述べています。
本論文は、埋め込み次元によって表現可能な上位 k 個の文書集合の数が理論的に制限されることを示し、単純なクエリであっても最先端のモデルがこの制約により失敗することを実証することで、単一ベクトルパラダイムの根本的な限界を明らかにしている。
本論文は、高レベルの計画と低レベルの実行に異なる知識が必要であるという洞察に基づき、両段階でそれぞれ適切な知識を検索して活用する階層的マルチエージェントフレームワーク「Mobile-Agent-RAG」を提案し、長期的で複雑なモバイル自動化タスクの成功率と効率を大幅に向上させることを示しています。
位置バイアスを長さと分離して体系的に診断する初の標準ベンチマーク「PosIR」を提案し、10 言語 31 ドメインのデータセットを用いた評価により、埋め込みモデルにおける位置バイアスの普遍性と、現在の短文評価の限界を明らかにしました。
本論文は、検索を伴う推論におけるクレジット割り当て問題を解決するため、共通の接頭辞を持つ切り捨てられたステップレベルのサンプリングと、LLM を用いた分解されたプロセス報酬を組み合わせた新しいフレームワーク「SLATE」を提案し、理論的および実験的にその有効性を証明したものである。
この論文は、引用グラフ上の各ノードで局所的なリーマン計量を学習し、測地線距離に基づく幾何学的な意味検索を行う「Geodesic Semantic Search (GSS)」を提案し、従来の手法と比較してリコールを大幅に向上させつつ、解釈可能な引用経路の提供と計算コストの削減を実現したことを報告しています。
この論文は、実世界の国際制裁データから構築された大規模なエンティティマッチングベンチマーク「OpenSanctions Pairs」を公開し、既存のルールベース手法を大幅に上回る精度で LLM が機能することを実証するとともに、今後の研究の焦点をペアマッチングからブロッキングやクラスタリングなどのパイプライン構成要素へシフトさせる必要性を提言しています。
この論文は、知識グラフに基づく検索拡張生成(RAG)の課題を解決するため、エントリ要約と triple 記述を統合する新しいインデックス手法「MDER」と、クエリ分解と反復推論による検索手法「DR」を組み合わせた多ホップ質問応答フレームワーク「MDER-DR」を提案し、標準およびドメイン固有のベンチマークにおいて既存手法を大幅に上回る性能向上を実証したものである。
この論文は、ユーザーが記憶制約と時間制約の下で戦略的にリンクを探索する逐次意思決定プロセスとして情報香りを再定義し、モデルが実際のナビゲーションにおける誤選択やバックトラックを含む試行錯誤行動を再現できることを示しています。
この論文は、YouTube の推薦システムに関するバイアスを推論する監査において、ログイン状態などの方法論的選択が結果に与える影響を分析し、精度を損なわずに監査コストを削減できる最適な設定と、慎重に考慮すべきパラメータを明らかにしています。
本論文は、従来の知識ベースおよび機械学習ベースのアプローチに代わる新たなパラダイムとして、検索とマッチングを行う二つのシエーズエージェントと一連のツールで構成されるLLMエージェント駆動型のオントロジー整合フレームワーク「Agent-OM」を提案し、OAEI 評価において複雑なタスクや少数ショットタスクで顕著な性能向上を実証したものである。
本論文は、構造化された法的文書情報をより効果的に活用し、大規模言語モデルによる文脈化された埋め込みとグラフ対照学習を組み合わせることで、既存の手法を大幅に上回る性能を達成する新しい法律判例検索モデル「LEXA」を提案するものである。
この論文は、類似性と多様性を同時に満たすベクトル検索問題(VRSD)が NP 完全であることを理論的に証明し、パラメータ不要のヒューリスティック手法を提案することで、既存の手法を上回る性能を実現することを示しています。
この論文は、LLM と SLM の協調、逆画像検索、知識グラフ、説得戦略分析を統合したマルチペルソナ型エージェントフレームワーク「AMPEND-LS」を提案し、多様なデータソースからの証拠に基づいて多モーダルなフェイクニュースを検出・説明する能力を大幅に向上させたことを示しています。
本論文は、有向グラフにおけるリンクの符号予測タスクにおいて、Gaussian コプラを用いたエッジ間相関モデルの計算コストを削減し、線形収束性を証明することで、既存モデルよりも高速な収束と高い予測精度を実現する拡張手法を提案しています。
この論文は、2014 年から 2023 年にかけての Web of Science データに基づく文献計量分析を通じて、鳥インフルエンザ研究の出版動向、主要な国・機関、協力ネットワーク、およびドキュメントタイプを包括的に概観し、国境を越えた協力の重要性を浮き彫りにしています。
この論文は、コントラスト学習において埋め込みの大きさをノイズと見なす従来のコサイン類似度の仮定を再考し、クエリとドキュメントの役割に応じた非対称な正規化戦略が、特に検索や RAG におけるドメイン外汎化性能の向上に寄与することを示しています。
本論文は、アリババのEC プラットフォームで実証された、絶対 ID 認識に基づく埋め込みと比較・較正リストワイズポリシーを採用した reranker により、産業用マルチモーダル検索の精度とリアルタイム性を飛躍的に向上させた「Pailitao-VL」システムを提案するものである。
本論文は、従来の推薦モデルの効率的な協調フィルタリング能力を維持しつつ、自然言語プロンプトによるユーザーの明示的な意図を動的に反映して検索を制御する「Decoupled Promptable Sequential Recommendation (DPR)」という新しいフレームワークを提案し、実データでの実験によりその有効性を示しています。
本論文は、RAG 実験と生産システム間のギャップを埋めるため、データ表現・埋め込み・検索ロジックを分離したモジュラー型基盤「SearchGym」を提案し、ハイブリッド検索の最適順序に関する分析と LitSearch ベンチマークでの高い性能を実証しています。