Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track
TREC 2025 RAG 赛道通过引入长叙事查询、基于 MS MARCO V2.1 语料库的多层评估框架以及强调归因验证,旨在推动构建透明、事实性强且具备推理能力的检索增强生成系统。
3533 篇论文
TREC 2025 RAG 赛道通过引入长叙事查询、基于 MS MARCO V2.1 语料库的多层评估框架以及强调归因验证,旨在推动构建透明、事实性强且具备推理能力的检索增强生成系统。
本文提出了首个面向体育场景的大规模空间智能数据集 CourtSI 及其基准测试 CourtSI-Bench,通过利用球场几何结构构建百万级问答数据,揭示了现有视觉语言模型在体育空间推理上的局限性,并验证了基于该数据微调模型可显著提升其在空间理解与评论生成方面的性能。
本文通过博弈论模型和仿真证明,现有的 802.11 分布式 MAC 协议在非合作环境下会导致节点陷入低效的纳什均衡,而若能实现信道资源分配与节点传输策略的解耦,则可使所有竞争节点获得比 DCF 更高的吞吐量。
本文定义了一种基于连接模式的企业网络主机角色分类问题,提出了两种能应对模式动态变化的实用算法,并将其集成到商业监控产品中,实验结果表明该算法能将主机分组数量大幅缩减并准确反映网络的逻辑结构。
该论文提出了 WikiCLIP,一种利用大语言模型嵌入和视觉引导知识适配器的高效对比学习框架,在显著提升开放域视觉实体识别性能的同时,将推理延迟降低了近 100 倍。
该论文揭示了点云优化中 Chamfer 距离因梯度结构缺陷导致点云坍缩的内在机制,并证明引入非局部耦合(如共享基变形或可微 MPM 先验)是抑制坍缩、提升优化效果的关键。
该论文提出了一套跨数据库与 SSD 层的“非原地写入”优化方案,通过重新设计 LeanStore 存储引擎,显著降低了写放大并提升了 OLTP 工作负载下的吞吐量与 SSD 寿命,同时兼容 ZNS 等新型 SSD 接口。
该论文提出了一种基于关节角运动图像与 Token-Patch 晚期交互的可解释细粒度文本 - 动作检索方法,通过将局部关节特征映射为伪图像并结合掩码语言模型正则化,克服了现有全局嵌入方法在细粒度对应和可解释性上的不足,在 HumanML3D 和 KIT-ML 数据集上实现了超越最先进水平的检索性能。
该论文提出了一种基于改进的 Margin Disparity Discrepancy(MDD)的无监督域自适应框架,利用大量标注 CT 数据与未标注介入性 CBCT 数据,有效解决了介入放射学中肝脏分割任务因数据稀缺和模态差异带来的挑战,并实现了最先进的性能。
该论文提出了一种基于超空间几何和 Voronoi 单元估计的框架,通过量化令牌在嵌入空间中的影响区域,为晚期交互检索模型提供了一种兼具理论严谨性与高效性的令牌剪枝方法,在显著降低索引存储开销的同时保持了检索性能。
该论文提出了一种基于专家与非专家病理学家诊断分歧的“全切片难度”(WSD)概念,并通过多任务学习和加权分类损失两种方法将其融入前列腺癌 Gleason 分级任务中,实验结果表明该方法能显著提升不同特征编码器和多实例学习模型的性能,尤其改善了对高 Gleason 分级(即更严重病情)的分类效果。
本文提出了名为 KDMR 的框架,通过将人形机器人运动重定向建模为多接触全身轨迹优化问题,并显式结合刚体动力学与地面反作用力数据,有效解决了传统纯运动学方法导致的物理不一致性问题,从而生成了动力学可行且平滑的参考轨迹,显著提升了下游模仿学习策略的训练效率与 locomotion 稳定性。
该论文证明了在标准旋转系统下,除 O 型外所有四连方块(tetromino)的 Tetris 清除与生存问题均为 NP 难,从而推翻了关于仅使用 I 型方块的旧猜想,同时给出了仅使用多米诺骨牌或特定初始条件下 $1\times k$ 方块的清除与生存问题的多项式时间算法。
ReCoSplat 提出了一种利用“渲染 - 比较”模块来补偿姿态误差的自回归前馈高斯泼溅模型,并结合混合 KV 缓存压缩策略,实现了在有无相机位姿及内参条件下对长序列视频的高效在线新视图合成。
本文提出了 TiPToP,一种结合预训练视觉基础模型与任务运动规划器(TAMP)的模块化开放词汇系统,仅需 RGB 图像和自然语言指令即可在零机器人数据的情况下解决多步操作任务,并在仿真与真实世界中展现出优于基于 350 小时演示微调的 VLA 模型的性能。
该论文提出了一种将 d-DNNF 知识编译技术扩展至 SMT 层面的通用框架,通过结合预计算理论引理将 SMT 查询转化为命题逻辑问题,从而利用现有的 d-DNNF 编译器实现多项式时间的 SMT 查询。
本文提出了一种基于智能体(Agent)的防空系统决策模型,利用信念 - 愿望 - 意图(BDI)架构和元级规划推理,实现了无需人工干预的自动化目标探测、威胁评估及武器分配,从而提升了网络中心战环境下的指挥控制自主性。
该论文通过均衡模型分析了社交媒体中用户基于私人和公共信号分享新闻的决策机制,揭示了算法优先展示高传播度内容虽能提升信息聚合效率,但也可能引发错误信息自我强化的稳态,从而为平台设计提供了重要启示。
本文提出了一种结合可信区间的新型统计学习方法,通过非参数密度估计和两项创新策略,在确保拍卖机制公平性、激励相容性及个体理性高概率成立的前提下,有效降低了多物品拍卖的实施成本并实现了收益最大化。
该论文针对混合目标域适应中类别分布偏移和伪标签生成困难的问题,提出了一种通过不确定性引导的类别判别器显式对齐 并利用低层特征增强以校正 的互条件对齐机制,从而在不依赖域标签的情况下显著提升了模型性能。