cs.IR 件の論文 | Gist.Science

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

本論文は、CERN の CMS 実験など大規模科学コラボレーションにおける機密性を保ちつつ、内部ドキュメントから高精度に知識を抽出・回答するためのオンプレミス型 RAG ベースの AI アシスタント「MITRA」のプロトタイプとその評価結果を提示しています。

Abhishikth Mallampalli, Sridhara DasuWed, 11 Ma🤖 cs.AI

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

この論文は、推薦エージェントが受動的な情報処理から自律的な調査へ移行できるよう、ユーザーやアイテム、協調的な情報の不足を動的に分析・補完し、専門ツールを自律的に活用して推論を行う「RecThinker」というフレームワークを提案し、その性能を実証したものです。

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng DouWed, 11 Ma💻 cs

Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track

TREC 2025 RAG トラックは、MS MARCO V2.1 コーパスを用い、複雑な推論を要する長文ナラティブクエリへの対応や、透明性・事実性のある回答生成を評価対象として、信頼性の高い検索拡張生成システムの開発を促進するものです。

Shivani Upadhyay, Nandan Thakur, Ronak Pradeep, Nick Craswell, Daniel Campos, Jimmy LinWed, 11 Ma💻 cs

Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

この論文は、関節角度に基づく擬似画像表現とトークン単位の遅延相互作用（MaxSim）を組み合わせることで、既存の手法が抱える細粒度対応の欠如や解釈性の低さを克服し、テキストと 3 次元人間の動きの間の高精度かつ解釈可能な検索を実現する手法を提案しています。

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu XiaoWed, 11 Ma💻 cs

A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models

この論文は、遅延相互作用型検索モデルにおけるトークンプルーニングを埋め込み空間のボロノイ細胞推定問題として定式化し、幾何学的な原理に基づいてインデックスサイズを削減しつつ検索品質を維持する新たな枠組みを提案しています。

Yash Kankanampati, Yuxuan Zong, Nadi Tomeh, Benjamin Piwowarksi, Joseph Le RouxWed, 11 Ma💻 cs

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

本論文は、従来の心理測定学に依存するコンピュータ適応型テスト（CAT）の枠組みを、測定モデルや問題選択アルゴリズムなどの主要構成要素に機械学習を統合する新たな視点から包括的に調査し、より強健で公平かつ効率的な次世代テストシステムの構築を提唱するものです。

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

この論文は、ベトナム語話者の農家向けに、音声認識、RAG（検索拡張生成）技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。 ※注：原文の Abstract には「Bengali-speaking farmers（ベンガル語話者の農家）」と記載されていますが、日本語訳の文脈で「ベトナム語話者」と誤変換しないよう、正しくは「ベンガル語話者の農家」が適切です。以下に修正版を提示します。 **修正版:** この論文は、ベンガル語話者の農家向けに、音声認識、RAG（検索拡張生成）技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

LLM 推薦システムにおける継続学習の課題を解決するため、過去のタスク維持ではなく現在のユーザー行動への適応を重視し、直近の凍結状態を基準とした近傍正則化を導入した新たな LoRA 適応手法「PESO」を提案し、理論的・実証的に既存手法を上回る性能を実証した論文です。

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang TongTue, 10 Ma🤖 cs.LG

Semantic Search over 9 Million Mathematical Theorems

この論文は、arXiv などの 920 万件の定理を網羅する大規模コーパスを用いて、自然言語記述による意味検索が数学者による専門的な定理検索において既存手法を大幅に上回る有効性を有することを示しています。

Luke Alexander, Eric Leonen, Sophie Szeto, Artemii Remizov, Ignacio Tejeda, Jarod Alper, Giovanni Inchiostro, Vasily IlinTue, 10 Ma🔢 math

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

この論文は、ベクトル検索と知識グラフを組み合わせたハイブリッド RAG システムにおいて、個別のコンポーネントが安全であっても結合点での権限確認が欠如すると、意図しないデータ漏洩を引き起こす「リトリーバル・ピボット攻撃」の存在を明らかにし、グラフ拡張の境界でアクセス制御を再適用することでこのリスクを低コストで解消できることを示しています。

Scott ThorntonTue, 10 Ma🤖 cs.LG

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

App Store の検索ランキングにおいて、LLM を活用して生成したテキスト関連性ラベルを行動データと組み合わせることで、オフライン評価指標の改善と、特にロングテールクエリにおけるコンバージョン率の統計的有意な向上（+0.24%）を実現した。

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat SundaranathaTue, 10 Ma🤖 cs.LG

Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing

この論文は、ニューラルアーキテクチャに直接統合された「等方性層（Isotonic Layer）」という新しいフレームワークを提案し、特徴空間の分割と非負の傾き最適化を通じてモデルの出力に単調性を強制することで、推薦システムのバイアス除去と較正精度を大幅に向上させることを実証しています。

Hailing Cheng, Yafang Yang, Hemeng Tao, Fengyu ZhangTue, 10 Ma🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

この論文は、知識空間理論を位置情報推薦に応用し、訪問地点間の前提依存関係を格子論的に定式化した「探索空間理論（EST）」を提案し、その数学的構造に基づいて構造的妥当性が保証された推薦システム（ESRS）を構築することを目的としています。

Madjid SadallahTue, 10 Ma🤖 cs.LG

T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

本論文は、オンライン生鮮食品ショッピングにおける反復的な購入パターンや複雑なアイテム関係といった課題に対処するため、動的シーケンス分割、適応的ポジショナルエンコーディング、カテゴリレベルモデリングという 3 つの革新を導入し、BERT4Rec などの既存手法よりも優れた次回の買い物かご予測を実現するトランスフォーマーベースのモデル「T-REX」を提案するものである。

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy ZubatiyTue, 10 Ma🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan XiaoTue, 10 Ma🤖 cs.LG

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

本論文は、画像と点雲を事前整合されたエンコーダで共通空間に埋め込むアプローチと、マルチモーダルなハードコントラスト損失の導入により、ビュー合成や再学習なしにゼロショットおよび標準的な画像ベースの形状検索において最先端の性能を達成することを示しています。

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil SinhaTue, 10 Ma💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

この論文は、キーワード検索、API によるデータ取得、そして大規模言語モデル（LLM）を活用したテキスト分類を統合した自動化フレームワークを提案し、農業分野などの検証により、専門家が手作業で構築するデータベースと 90% 一致する精度で、科学データベースの構築における手作業の負担を大幅に軽減できることを示しています。

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico GomezTue, 10 Ma💻 cs

Multi-TAP: Multi-criteria Target Adaptive Persona Modeling for Cross-Domain Recommendation

既存のクロスドメイン推薦手法が見過ごしがちなドメイン内でのユーザー嗜好の異質性を、セマンティックなペルソナモデルとターゲット適応型メカニズムを通じて捉えることで、データ疎性を効果的に緩和し最先端の性能を達成する「Multi-TAP」という新しいフレームワークを提案する論文です。

Daehee Kang, Yeon-Chang LeeTue, 10 Ma💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

この論文は、生成モデルの推論遅延とユーザー・アイテム間の相互作用不足という課題を解決するため、半自己回帰生成とオンライン知識蒸留を組み合わせた効率的なパーソナライズド再ランク付けフレームワーク「PSAD」を提案し、大規模データセットでの実験によりその高性能と高効率を実証したものである。

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong ChenTue, 10 Ma💻 cs

Fine-Grained Table Retrieval Through the Lens of Complex Queries

この論文は、複雑な自然言語クエリに対するオープンドメインの質問応答を可能にするため、細粒度の型付きクエリ分解とグローバルな接続性認識を組み合わせたテーブル検索手法「DCTR」を提案し、その有効性を検証したものです。

Wojciech Kosiuk, Xingyu Ji, Yeounoh Chung, Fatma Özcan, Madelon HulsebosTue, 10 Ma💬 cs.CL

← 前へ次へ →