cs.IR 篇论文 | Gist.Science

Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG

该论文提出了 GFM-Retriever，一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架，旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题，从而实现高效且可解释的多跳推理。

Haonan Yuan, Qingyun Sun, Junhua Shi, Mingjun Liu, Jiaqi Yuan, Ziwei Zhang, Xingcheng Fu, Jianxin LiTue, 10 Ma💻 cs

Detecting Cryptographically Relevant Software Packages with Collaborative LLMs

该论文提出了一种基于多模型协作与多数投票机制的本地化大语言模型框架，用于高效、隐私安全地自动识别海量软件包中的加密相关资产，以辅助应对量子计算威胁并推动后量子密码迁移。

Eduard Hirsch, Kristina Raab, Tobias J. Bauer, Daniel LoebenbergerTue, 10 Ma💻 cs

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

该论文提出了 PT-RAG 框架，通过引入一种结合 GenePT 嵌入与 Gumbel-Softmax 采样的两阶段可微检索机制，实现了细胞类型感知的上下文检索，从而显著提升了基因扰动下细胞反应预测的准确性，并证明了在该领域可微检索对于避免性能下降至关重要。

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro LiòTue, 10 Ma🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

该论文提出了名为 WeDas 的框架，通过引入查询 - 结果对齐评分和少样本探测机制，使智能体能够感知并适应网络内容的分布结构，从而有效弥合了深度推理与底层检索之间的差距，显著提升了多基准测试中的子目标完成度与准确性。

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo HanTue, 10 Ma🤖 cs.LG

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

AutoDataset 是一个轻量级自动化系统，通过持续监控 arXiv 并利用多阶段流水线从新论文中实时提取和索引数据集信息，从而显著解决了现有平台依赖人工策展导致的覆盖不足和延迟问题，将研究人员发现新数据集的效率提升了高达 80%。

Junzhe Yang, Xinghao Chen, Yunuo Liu, Zhijing Sun, Wenjin Guo, Xiaoyu ShenTue, 10 Ma💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

该研究通过实证分析发现，在部署约束下，四种主流大语言模型生成的学术引用存在率极低（最高仅 47.5%），且大量“未解决”的引用实为虚构，因此强烈建议在将其用于软件工程文献综述或工具链前必须进行事后引用验证。

Chen Zhao, Yuan Tang, Yitian QianTue, 10 Ma💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

这篇论文首次提出了一个统一框架，将代理式检索增强生成（Agentic RAG）系统形式化为序贯决策过程，并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva GaireTue, 10 Ma💬 cs.CL

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本文提出了 Dial，一种基于知识的地域特定 NL2SQL 系统，通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环，有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题，并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan WuTue, 10 Ma🤖 cs.LG

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

SeDa 是一个统一框架，通过整合来自 200 多个平台的 760 多万份数据集，利用语义标准化、主题标签图及多实体增强导航策略，解决了跨源数据发现碎片化问题，实现了比现有平台更优越的覆盖度、时效性和可追溯性。

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng FanTue, 10 Ma💻 cs

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

本文提出了一种名为 GP-Tree 的新型内存空间索引，它通过将空间对象的细粒度网格单元编码组织为前缀树结构，并辅以剪枝等优化策略，有效克服了传统索引在处理复杂空间对象时的精度与性能瓶颈，在多种空间查询任务中实现了比传统索引高出一个数量级的效率提升。

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao WangTue, 10 Ma💻 cs

Deep Research for Recommender Systems

该论文提出了名为 RecPilot 的多智能体框架，通过用主动生成的用户导向深度研究报告取代传统的物品列表，将推荐系统从被动过滤工具重塑为能够自主探索并辅助决策的主动智能助手。

Kesha Ou, Chenghao Wu, Xiaolei Wang, Bowen Zheng, Wayne Xin Zhao, Weitao Li, Long Zhang, Sheng Chen, Ji-Rong WenTue, 10 Ma💻 cs

Verifiable Reasoning for LLM-based Generative Recommendation

该论文针对现有大语言模型生成式推荐中因缺乏中间验证而导致的推理退化问题，提出了名为 VRec 的“推理 - 验证 - 推荐”新范式，通过引入混合验证器与代理预测目标实现多维度可靠验证，从而显著提升了推荐效果与可扩展性。

Xinyu Lin, Hanqing Zeng, Hanchao Yu, Yinglong Xia, Jiang Zhang, Aashu Singh, Fei Liu, Wenjie Wang, Fuli Feng, Tat-Seng Chua, Qifan WangTue, 10 Ma💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

该论文提出了 SynPlanResearch-R1 框架，通过合成鼓励深度探索的工具使用轨迹来优化冷启动监督微调，从而有效解决了强化学习在研究智能体探索行为上的不足，并在多个基准测试中显著提升了基于 Qwen3 模型的研究性能。

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo ShangTue, 10 Ma💬 cs.CL

Structure-Preserving Graph Contrastive Learning for Mathematical Information Retrieval

该论文提出了一种名为“变量替换”的领域特定图增强技术，旨在解决通用增强方法在数学公式检索中破坏语义结构的问题，实验表明该方法能显著提升基于图对比学习的检索性能。

Chun-Hsi Ku, Hung-Hsuan ChenTue, 10 Ma💻 cs

Why Large Language Models can Secretly Outperform Embedding Similarity in Information Retrieval

该论文指出，虽然基于推理的大语言模型检索系统（LLM-RJS）理论上能克服嵌入相似度方法的短视局限并超越其性能，但现有标注数据集因同样存在短视缺陷而无法有效评估这一优势。

Matei Benescu, Ivo Pascal de JongTue, 10 Ma💻 cs

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

本文针对现有搜索代理难以获取未被搜索引擎索引信息（UIS）的局限，提出了首个 UIS 基准测试 UIS-QA 及名为 UIS-Digger 的多智能体框架，通过双模式浏览和文件解析能力，在仅使用约 300 亿参数模型的情况下显著超越了包含 O3 和 GPT-4.1 在内的先进系统，为构建全面的信息搜索代理开辟了新方向。

Chang Liu, Chuqiao Kuang, Tianyi Zhuang, Yuxin Cheng, Huichi Zhou, Xiaoguang Li, Lifeng ShangTue, 10 Ma💻 cs

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

本文提出了 SPD-RAG，一种通过为每份文档分配专用代理进行聚焦检索、再由协调器聚合合成答案的分层多智能体框架，在长文档问答任务中显著提升了答案质量并大幅降低了 API 成本。

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda AkpinarTue, 10 Ma💬 cs.CL

ERASE -- A Real-World Aligned Benchmark for Unlearning in Recommender Systems

本文提出了 ERASE，这是一个针对推荐系统的大规模机器遗忘基准，旨在通过涵盖多种任务、真实场景及广泛算法与数据集，解决现有基准脱离实际应用的问题，并系统评估了不同遗忘方法在效率与鲁棒性方面的表现。

Pierre Lubitzsch, Maarten de Rijke, Sebastian SchelterTue, 10 Ma💻 cs

Unifying On- and Off-Policy Variance Reduction Methods

该论文通过证明在线均值差估计量与带有最优控制变量的离线逆倾向评分估计量等价，以及回归调整方法与双重鲁棒估计的结构一致性，统一了在线实验与离线策略评估中常用的方差缩减方法。

Olivier JeunenTue, 10 Ma🤖 cs.LG

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

该论文提出了一种通过轻量级投影头将 LLM 代理隐藏状态直接映射为检索嵌入的方法，从而消除了对独立嵌入模型的依赖，在保持 97% 基线检索质量的同时降低了系统复杂度和延迟。

Bo JiangTue, 10 Ma💬 cs.CL