MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations
本論文は、CERN の CMS 実験など大規模科学コラボレーションにおける機密性を保ちつつ、内部ドキュメントから高精度に知識を抽出・回答するためのオンプレミス型 RAG ベースの AI アシスタント「MITRA」のプロトタイプとその評価結果を提示しています。
142 件の論文
本論文は、CERN の CMS 実験など大規模科学コラボレーションにおける機密性を保ちつつ、内部ドキュメントから高精度に知識を抽出・回答するためのオンプレミス型 RAG ベースの AI アシスタント「MITRA」のプロトタイプとその評価結果を提示しています。
この論文は、推薦エージェントが受動的な情報処理から自律的な調査へ移行できるよう、ユーザーやアイテム、協調的な情報の不足を動的に分析・補完し、専門ツールを自律的に活用して推論を行う「RecThinker」というフレームワークを提案し、その性能を実証したものです。
TREC 2025 RAG トラックは、MS MARCO V2.1 コーパスを用い、複雑な推論を要する長文ナラティブクエリへの対応や、透明性・事実性のある回答生成を評価対象として、信頼性の高い検索拡張生成システムの開発を促進するものです。
この論文は、関節角度に基づく擬似画像表現とトークン単位の遅延相互作用(MaxSim)を組み合わせることで、既存の手法が抱える細粒度対応の欠如や解釈性の低さを克服し、テキストと 3 次元人間の動きの間の高精度かつ解釈可能な検索を実現する手法を提案しています。
この論文は、遅延相互作用型検索モデルにおけるトークンプルーニングを埋め込み空間のボロノイ細胞推定問題として定式化し、幾何学的な原理に基づいてインデックスサイズを削減しつつ検索品質を維持する新たな枠組みを提案しています。
本論文は、従来の心理測定学に依存するコンピュータ適応型テスト(CAT)の枠組みを、測定モデルや問題選択アルゴリズムなどの主要構成要素に機械学習を統合する新たな視点から包括的に調査し、より強健で公平かつ効率的な次世代テストシステムの構築を提唱するものです。
この論文は、ベトナム語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。 ※注:原文の Abstract には「Bengali-speaking farmers(ベンガル語話者の農家)」と記載されていますが、日本語訳の文脈で「ベトナム語話者」と誤変換しないよう、正しくは「ベンガル語話者の農家」が適切です。以下に修正版を提示します。 **修正版:** この論文は、ベンガル語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。
LLM 推薦システムにおける継続学習の課題を解決するため、過去のタスク維持ではなく現在のユーザー行動への適応を重視し、直近の凍結状態を基準とした近傍正則化を導入した新たな LoRA 適応手法「PESO」を提案し、理論的・実証的に既存手法を上回る性能を実証した論文です。
この論文は、arXiv などの 920 万件の定理を網羅する大規模コーパスを用いて、自然言語記述による意味検索が数学者による専門的な定理検索において既存手法を大幅に上回る有効性を有することを示しています。
この論文は、ベクトル検索と知識グラフを組み合わせたハイブリッド RAG システムにおいて、個別のコンポーネントが安全であっても結合点での権限確認が欠如すると、意図しないデータ漏洩を引き起こす「リトリーバル・ピボット攻撃」の存在を明らかにし、グラフ拡張の境界でアクセス制御を再適用することでこのリスクを低コストで解消できることを示しています。
App Store の検索ランキングにおいて、LLM を活用して生成したテキスト関連性ラベルを行動データと組み合わせることで、オフライン評価指標の改善と、特にロングテールクエリにおけるコンバージョン率の統計的有意な向上(+0.24%)を実現した。
この論文は、ニューラルアーキテクチャに直接統合された「等方性層(Isotonic Layer)」という新しいフレームワークを提案し、特徴空間の分割と非負の傾き最適化を通じてモデルの出力に単調性を強制することで、推薦システムのバイアス除去と較正精度を大幅に向上させることを実証しています。
この論文は、知識空間理論を位置情報推薦に応用し、訪問地点間の前提依存関係を格子論的に定式化した「探索空間理論(EST)」を提案し、その数学的構造に基づいて構造的妥当性が保証された推薦システム(ESRS)を構築することを目的としています。
本論文は、オンライン生鮮食品ショッピングにおける反復的な購入パターンや複雑なアイテム関係といった課題に対処するため、動的シーケンス分割、適応的ポジショナルエンコーディング、カテゴリレベルモデリングという 3 つの革新を導入し、BERT4Rec などの既存手法よりも優れた次回の買い物かご予測を実現するトランスフォーマーベースのモデル「T-REX」を提案するものである。
本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。
本論文は、画像と点雲を事前整合されたエンコーダで共通空間に埋め込むアプローチと、マルチモーダルなハードコントラスト損失の導入により、ビュー合成や再学習なしにゼロショットおよび標準的な画像ベースの形状検索において最先端の性能を達成することを示しています。
この論文は、キーワード検索、API によるデータ取得、そして大規模言語モデル(LLM)を活用したテキスト分類を統合した自動化フレームワークを提案し、農業分野などの検証により、専門家が手作業で構築するデータベースと 90% 一致する精度で、科学データベースの構築における手作業の負担を大幅に軽減できることを示しています。
既存のクロスドメイン推薦手法が見過ごしがちなドメイン内でのユーザー嗜好の異質性を、セマンティックなペルソナモデルとターゲット適応型メカニズムを通じて捉えることで、データ疎性を効果的に緩和し最先端の性能を達成する「Multi-TAP」という新しいフレームワークを提案する論文です。
この論文は、生成モデルの推論遅延とユーザー・アイテム間の相互作用不足という課題を解決するため、半自己回帰生成とオンライン知識蒸留を組み合わせた効率的なパーソナライズド再ランク付けフレームワーク「PSAD」を提案し、大規模データセットでの実験によりその高性能と高効率を実証したものである。
この論文は、複雑な自然言語クエリに対するオープンドメインの質問応答を可能にするため、細粒度の型付きクエリ分解とグローバルな接続性認識を組み合わせたテーブル検索手法「DCTR」を提案し、その有効性を検証したものです。