cs.IR 件の論文 | Gist.Science

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

本論文は、事前学習済みグラフ基盤モデルを跨ドメインの検索器として活用し、情報ボトルネック原理に基づいてクエリに条件付けられた最小かつ十分な推論部分グラフを抽出する「GFM-Retriever」を提案し、マルチホップ推論における検索精度と回答生成の両方で最先端の性能を達成することを示しています。

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin LiTue, 10 Ma💻 cs

Detecting Cryptographically Relevant Software Packages with Collaborative LLMs

この論文は、プライバシーを保護しつつ大規模なソフトウェアパッケージから暗号関連資産を効率的に特定するために、複数の大規模言語モデル（LLM）を協調させて多数決で結果を統合するオンプレミス型のフレームワークを提案し、その有効性を検証したものです。

Eduard Hirsch, Kristina Raab, Tobias J. Bauer, Daniel LoebenbergerTue, 10 Ma💻 cs

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

本論文は、遺伝子擾乱に対する細胞応答の予測において、従来の RAG では得られない性能向上を実現するため、細胞状態と入力擾乱の両方に条件付けられた微分可能な 2 段階検索機構を備えた新しいフレームワーク「PT-RAG」を提案し、その有効性を実証したものである。

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro LiòTue, 10 Ma🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

本論文は、検索エンジンと推論プロセスのミスマッチを解消し、検索空間の構造的特性をエージェントの観測空間に統合する「WeDas」フレームワークを提案し、動的な Web 環境におけるサブゴールの達成と精度を向上させることを目的としています。

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo HanTue, 10 Ma🤖 cs.LG

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

この論文は、arXiv の新着論文をリアルタイムで監視し、機械学習用データセットを自動で発見・検索できる軽量システム「AutoDataset」を提案し、従来の手動キュレーションに比べてデータセット発見の効率を最大 80% 向上させることを示しています。

Junzhe Yang, Xinghao Chen, Yunuo Liu, Zhijing Sun, Wenjin Guo, Xiaoyu ShenTue, 10 Ma💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

この論文は、4 つの言語モデルと 5 つの提示条件を用いた実証研究により、展開制約を課しても LLM が生成する引用の存在率は 47.5% 以下に留まり、形式は整っていても事実無根の引用が多数含まれることを明らかにし、技術文献レビューやツールパイプラインへの導入前に事後検証の必要性を説いています。

Chen Zhao, Yuan Tang, Yitian QianTue, 10 Ma💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

本論文は、自律的な意思決定システムとしてのアージェント型 RAG を初めて統一的に定式化し、その分類体系・アーキテクチャ・評価手法の課題を体系的に整理するとともに、信頼性の高い大規模システム構築に向けた将来の研究方向性を提示する包括的な知見の体系化（SoK）論文である。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva GaireTue, 10 Ma💬 cs.CL

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

本論文は、200 以上のプラットフォームから 760 万以上のデータセットを統合し、意味的注釈とマルチエンティティ拡張ナビゲーションを通じて、分散したデータエコシステムにおける信頼性の高いデータ発見と探索を実現する統一フレームワーク「SeDa」を提案するものである。

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng FanTue, 10 Ma💻 cs

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

この論文は、複雑な空間オブジェクトの効率的な検索を実現するため、粗い最小境界矩形に代わって微細なグリッドセルをプレフィックス木構造に組み合わせた新しいインメモリ空間インデックス「GP-Tree」を提案し、実データによる実験で従来の手法を最大で桁違いに凌駕する性能向上を実証しています。

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Deep Research for Recommender Systems

この論文は、従来の受動的なアイテム提示に代わり、ユーザーの探索をシミュレートし意思決定を支援する統合レポートを生成するマルチエージェントフレームワーク「RecPilot」を提案し、推薦システムを能動的なアシスタントへと進化させる新たなパラダイムを確立することを主張しています。

Kesha Ou, Chenghao Wu, Xiaolei Wang, Bowen Zheng, Wayne Xin Zhao, Weitao Li, Long Zhang, Sheng Chen, Ji-Rong WenTue, 10 Ma💻 cs

Verifiable Reasoning for LLM-based Generative Recommendation

既存の「推論後推薦」アプローチが抱える推論の劣化問題を解決するため、推論と検証を交互に行う新たな「推論・検証・推薦」パラダイムと、その実装である VRec を提案し、複数の実世界データセットで推薦精度とスケーラビリティの向上を実証した。

Xinyu Lin, Hanqing Zeng, Hanchao Yu, Yinglong Xia, Jiang Zhang, Aashu Singh, Fei Liu, Wenjie Wang, Fuli Feng, Tat-Seng Chua, Qifan WangTue, 10 Ma💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

この論文は、強化学習単独では不十分な探索行動を改善するため、合成されたツール使用軌道を用いて冷たいスタート時の教師あり微調整を強化し、深層研究における探索を促進する「SynPlanResearch-R1」というフレームワークを提案し、複数のベンチマークで最先端の性能向上を実現したことを報告しています。

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo ShangTue, 10 Ma💬 cs.CL

Structure-Preserving Graph Contrastive Learning for Mathematical Information Retrieval

この論文は、数式検索におけるグラフ対照学習の文脈で、数式の構造的・意味的関係を保持するドメイン固有のグラフ増強手法「変数置換」を提案し、既存の汎用増強戦略と比較して検索性能を大幅に向上させることを示しています。

Chun-Hsi Ku, Hung-Hsuan ChenTue, 10 Ma💻 cs

Why Large Language Models can Secretly Outperform Embedding Similarity in Information Retrieval

この論文は、LLM を用いた推論ベースの検索システムが埋め込み類似性に基づくシステムよりも「短絡的」な関連性の限界を克服する可能性を有するものの、既存の標準的なアノテーションデータセットではその優位性を評価できないと結論付けています。

Matei Benescu, Ivo Pascal de JongTue, 10 Ma💻 cs

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

本論文は、検索エンジンにインデックスされていない情報（非インデックス情報）の探索という新たな課題を定義し、初のベンチマーク「UIS-QA」と、効率的なマルチエージェントフレームワーク「UIS-Digger」を提案することで、現在の検索エージェントの限界を克服し、包括的な情報探索システムの発展に寄与するものです。

Chang Liu, Chuqiao Kuang, Tianyi Zhuang, Yuxin Cheng, Huichi Zhou, Xiaoguang Li, Lifeng ShangTue, 10 Ma💻 cs

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

SPD-RAG は、各ドキュメントを個別に処理する専門エージェントと調整エージェントを階層的に組み合わせ、大規模な多ドキュメント環境における複雑な質問への回答精度を向上させつつ、API コストを大幅に削減する新しい検索拡張生成フレームワークを提案するものです。

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda AkpinarTue, 10 Ma💬 cs.CL

ERASE -- A Real-World Aligned Benchmark for Unlearning in Recommender Systems

推薦システムにおける機械的忘却（MU）の実用性を評価するため、現実のユースケースに即した大規模ベンチマーク「ERASE」を提案し、既存手法の限界と課題を体系的に分析した。

Pierre Lubitzsch, Maarten de Rijke, Sebastian SchelterTue, 10 Ma💻 cs

Unifying On- and Off-Policy Variance Reduction Methods

この論文は、オンラインの差の平均推定量と最適な制御変量を用いたオフポリシー逆確率重み付け推定量、そして回帰調整手法と二重頑健推定量の間に形式的な等価性を確立し、A/B テストとオフポリシー評価の分野を統一的な視点で結びつけることで、両分野の実践者や研究者の理解を深めることを目指しています。

Olivier JeunenTue, 10 Ma🤖 cs.LG

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

この論文は、LLM の隠れ状態から軽量な投影ヘッドを用いて直接検索埋め込みを生成する手法を提案し、従来の「生成後エンコード」パイプラインを不要にしながらも、QReCC ベンチマークで基線モデルの検索品質の 97% を維持できることを示しています。

Bo JiangTue, 10 Ma💬 cs.CL

← 前へ次へ →