KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation
该论文针对基于图检索增强生成(GraphRAG)系统因依赖外部数据而面临的安全隐患,提出了一种名为 KEPo 的新型投毒攻击方法,通过构建伪造的知识演化路径将有毒事件注入知识图谱,从而有效误导大语言模型生成攻击者预设的有害回答,并在单目标和多目标攻击场景下均取得了优于现有方法的攻击成功率。
3755 篇论文
该论文针对基于图检索增强生成(GraphRAG)系统因依赖外部数据而面临的安全隐患,提出了一种名为 KEPo 的新型投毒攻击方法,通过构建伪造的知识演化路径将有毒事件注入知识图谱,从而有效误导大语言模型生成攻击者预设的有害回答,并在单目标和多目标攻击场景下均取得了优于现有方法的攻击成功率。
该论文针对联邦推荐系统中因数据异构和稀疏性导致的通用物品嵌入学习困难问题,提出了一种名为 FedRecGEL 的新框架,通过从物品中心视角重构问题并结合锐度感知最小化技术,实现了更稳定的训练过程和更优的推荐性能。
针对推理模型长输出场景下 KV 缓存占用高及现有压缩方法效率低的问题,本文提出了 LongFlow,一种基于当前查询中间结果进行高效重要性评估、无需额外存储且通过自定义融合算子实现的 KV 缓存压缩方法,在保持模型精度基本不变的同时实现了高达 80% 的缓存压缩和 11.8 倍的吞吐量提升。
本文提出了 Gen-Fab,一种基于条件生成对抗网络(cGAN)的模型,能够根据纳米光子器件的设计布局生成高分辨率的制造结果预测,有效模拟过刻蚀、欠刻蚀及圆角等工艺变异,并在准确性和不确定性建模方面优于现有的确定性 U-Net 及蒙特卡洛 Dropout 等基线方法。
本文提出了一种基于条件特征解耦的 CFD-HAR 方法,旨在通过潜在空间分离活动与敏感属性来实现用户可控的隐私保护,并将其与基于自编码器的少样本 HAR 方案在架构、隐私保障及数据效率等方面进行了对比分析,指出单一范式难以满足下一代 IoT 需求,进而呼吁构建兼顾隐私、适应性与鲁棒性的统一框架。
该论文针对真实平台搜索行为分析场景,提出了一种在随机序约束下估计多个离散单峰分布的混合整数凸二次优化方法,实验表明该方法在小样本情况下能显著降低分布估计误差,而在数据充足时表现与现有方法相当。
该论文提出了一种名为"One Supervisor, Many Modalities"的代理 AI 框架,通过中央协调器动态分解并路由文本、图像、音频等多模态任务至专用工具,在保持准确率的同时显著降低了响应时间、对话重做率和成本。
该论文提出了多任务反因果学习(MTAC)框架,通过利用跨任务不变性来学习共享因果图并重构潜在原因,在利用居民报告重建城市事件(如停车违规、废弃房产和卫生状况)的任务中显著提升了准确性。
本文提出了一种名为 CAETC 的新方法,通过结合对抗表示学习与自编码架构,在时间序列数据中构建部分可逆且治疗不变的表征,从而有效解决时间依赖混淆偏差问题并显著提升反事实估计的准确性。
该论文提出了一种将生存分析与分类技术相结合的新框架,利用大规模电子病历数据成功构建了五种常见慢性病的早期风险预测模型,其性能优于或媲美主流模型,并经由临床专家验证了生成的解释性。
本文提出了一种名为 H-EARS 的混合能量感知奖励塑形方法,通过将基于势函数的奖励塑形与能量感知动作正则化相结合,在无需完整系统动力学模型的情况下实现了线性复杂度,从而显著提升了深度强化学习在连续控制任务中的收敛速度、稳定性及能效。
AutoScout 提出了一种面向机器学习系统配置(涵盖训练、微调及推理)的通用优化框架,通过混合离散/连续优化与分层依赖建模,结合自适应特征优先级排序及多保真度模拟器集成,在显著降低配置搜索成本的同时实现了比专家调优快 2.7 至 3.0 倍的训练加速。
该论文系统研究了部分旋转位置编码(Partial RoPE)对 Transformer 模型训练动态和收敛性的影响,发现仅需对约 10% 的隐藏维度应用 RoPE 即可在保持与全量 RoPE 相当性能的同时实现高达 10 倍的显存节省,并为平衡效率与训练稳定性提供了实用指导。
本文提出了名为"Shape-of-You"的新框架,通过结合 3D 基础模型与锚点线性化的融合 Gromov-Wasserstein 最优传输方法,在无需显式几何标注的情况下解决了语义对应中的几何歧义问题,并在 SPair-71k 和 AP-10k 数据集上取得了最先进性能。
本文提出了基于高斯生成建模的个性化联邦学习方法 pFedGM,通过解耦特征提取与分类器、利用加权重采样建模客户端异质性,并引入受卡尔曼增益启发的双尺度融合框架,在兼顾全局协作与局部个性化的同时实现了优越的泛化性能。
该论文通过系统性研究揭示,对于大型预训练视觉 - 语言 - 动作(VLA)模型而言,结合低秩适应(LoRA)的简单序列微调策略在持续强化学习中表现卓越,不仅能有效避免灾难性遗忘并保留零样本泛化能力,其效果甚至优于复杂的持续学习方法。
本文提出了一种名为神经调节约束自编码器(NcAE)的新方法,通过引入神经调节机制动态调整几何约束参数,成功实现了在多变环境条件下解耦全局上下文与局部流形表示的自适应降维学习。
该论文指出传统策略梯度算法在训练过程中会自然降低熵值从而限制探索多样性,因此提出通过 REPO 和 ADAPO 等显式熵控制机制来维持策略的多样性,从而提升模型性能并增强其在后续环境中的持续学习能力。
本文提出了一种名为“因果韵律中介”的新型文本转语音框架,通过结合结构因果模型与反事实训练目标,在 FastSpeech2 架构中成功解耦了情感与语言内容,实现了可解释且可控的情感韵律编辑,显著提升了合成语音的情感表现力与跨说话人一致性。
本文针对决策树模型中因标签随机性导致的观测多重性,提出了叶节点遗憾与结构遗憾两种互补度量并建立理论分解框架,实验表明结构遗憾是多重性的主要驱动因素,且利用该度量进行选择性预测可显著提升模型安全性。