Retrieving Minimal and Sufficient Reasoning Subgraphs with Graph Foundation Models for Path-aware GraphRAG
该论文提出了 GFM-Retriever,一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架,旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题,从而实现高效且可解释的多跳推理。
144 篇论文
该论文提出了 GFM-Retriever,一种利用预训练图基础模型进行跨域检索并结合信息瓶颈原理筛选最小充分子图的框架,旨在解决 GraphRAG 在冷启动场景下的检索冗余与不完整问题,从而实现高效且可解释的多跳推理。
该论文提出了一种基于多模型协作与多数投票机制的本地化大语言模型框架,用于高效、隐私安全地自动识别海量软件包中的加密相关资产,以辅助应对量子计算威胁并推动后量子密码迁移。
该论文提出了 PT-RAG 框架,通过引入一种结合 GenePT 嵌入与 Gumbel-Softmax 采样的两阶段可微检索机制,实现了细胞类型感知的上下文检索,从而显著提升了基因扰动下细胞反应预测的准确性,并证明了在该领域可微检索对于避免性能下降至关重要。
该论文提出了名为 WeDas 的框架,通过引入查询 - 结果对齐评分和少样本探测机制,使智能体能够感知并适应网络内容的分布结构,从而有效弥合了深度推理与底层检索之间的差距,显著提升了多基准测试中的子目标完成度与准确性。
AutoDataset 是一个轻量级自动化系统,通过持续监控 arXiv 并利用多阶段流水线从新论文中实时提取和索引数据集信息,从而显著解决了现有平台依赖人工策展导致的覆盖不足和延迟问题,将研究人员发现新数据集的效率提升了高达 80%。
该研究通过实证分析发现,在部署约束下,四种主流大语言模型生成的学术引用存在率极低(最高仅 47.5%),且大量“未解决”的引用实为虚构,因此强烈建议在将其用于软件工程文献综述或工具链前必须进行事后引用验证。
这篇论文首次提出了一个统一框架,将代理式检索增强生成(Agentic RAG)系统形式化为序贯决策过程,并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。
本文提出了 Dial,一种基于知识的地域特定 NL2SQL 系统,通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环,有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题,并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。
SeDa 是一个统一框架,通过整合来自 200 多个平台的 760 多万份数据集,利用语义标准化、主题标签图及多实体增强导航策略,解决了跨源数据发现碎片化问题,实现了比现有平台更优越的覆盖度、时效性和可追溯性。
本文提出了一种名为 GP-Tree 的新型内存空间索引,它通过将空间对象的细粒度网格单元编码组织为前缀树结构,并辅以剪枝等优化策略,有效克服了传统索引在处理复杂空间对象时的精度与性能瓶颈,在多种空间查询任务中实现了比传统索引高出一个数量级的效率提升。
该论文提出了名为 RecPilot 的多智能体框架,通过用主动生成的用户导向深度研究报告取代传统的物品列表,将推荐系统从被动过滤工具重塑为能够自主探索并辅助决策的主动智能助手。
该论文针对现有大语言模型生成式推荐中因缺乏中间验证而导致的推理退化问题,提出了名为 VRec 的“推理 - 验证 - 推荐”新范式,通过引入混合验证器与代理预测目标实现多维度可靠验证,从而显著提升了推荐效果与可扩展性。
该论文提出了 SynPlanResearch-R1 框架,通过合成鼓励深度探索的工具使用轨迹来优化冷启动监督微调,从而有效解决了强化学习在研究智能体探索行为上的不足,并在多个基准测试中显著提升了基于 Qwen3 模型的研究性能。
该论文提出了一种名为“变量替换”的领域特定图增强技术,旨在解决通用增强方法在数学公式检索中破坏语义结构的问题,实验表明该方法能显著提升基于图对比学习的检索性能。
该论文指出,虽然基于推理的大语言模型检索系统(LLM-RJS)理论上能克服嵌入相似度方法的短视局限并超越其性能,但现有标注数据集因同样存在短视缺陷而无法有效评估这一优势。
本文针对现有搜索代理难以获取未被搜索引擎索引信息(UIS)的局限,提出了首个 UIS 基准测试 UIS-QA 及名为 UIS-Digger 的多智能体框架,通过双模式浏览和文件解析能力,在仅使用约 300 亿参数模型的情况下显著超越了包含 O3 和 GPT-4.1 在内的先进系统,为构建全面的信息搜索代理开辟了新方向。
本文提出了 SPD-RAG,一种通过为每份文档分配专用代理进行聚焦检索、再由协调器聚合合成答案的分层多智能体框架,在长文档问答任务中显著提升了答案质量并大幅降低了 API 成本。
本文提出了 ERASE,这是一个针对推荐系统的大规模机器遗忘基准,旨在通过涵盖多种任务、真实场景及广泛算法与数据集,解决现有基准脱离实际应用的问题,并系统评估了不同遗忘方法在效率与鲁棒性方面的表现。
该论文通过证明在线均值差估计量与带有最优控制变量的离线逆倾向评分估计量等价,以及回归调整方法与双重鲁棒估计的结构一致性,统一了在线实验与离线策略评估中常用的方差缩减方法。
该论文提出了一种通过轻量级投影头将 LLM 代理隐藏状态直接映射为检索嵌入的方法,从而消除了对独立嵌入模型的依赖,在保持 97% 基线检索质量的同时降低了系统复杂度和延迟。