Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences
该论文提出了“梯度流漂移”(Gradient Flow Drifting)这一生成建模新框架,从理论上证明了漂移模型等价于基于核密度估计(KDE)近似的前向 KL 散度的 Wasserstein 梯度流,并进一步通过混合散度策略与流形扩展,有效解决了模式坍塌与模糊问题。
4586 篇论文
该论文提出了“梯度流漂移”(Gradient Flow Drifting)这一生成建模新框架,从理论上证明了漂移模型等价于基于核密度估计(KDE)近似的前向 KL 散度的 Wasserstein 梯度流,并进一步通过混合散度策略与流形扩展,有效解决了模式坍塌与模糊问题。
本文介绍了一个基于 Optimistix 库的 JAX 实现,提供了包含缩放变体的自缩放 Broyden 族拟牛顿优化器(如 BFGS、DFP 等)及满足强 Wolfe 条件的 Zoom 线搜索,旨在记录技术细节并促进 JAX 社区对这些优化器的采用。
该论文提出了名为 Geo-ATBench 的地理空间音频标注基准及 GeoFusion-AT 融合框架,旨在通过引入地理信息系统提供的语义上下文(如兴趣点)来辅助多标签音频识别,从而有效解决仅靠音频波形难以区分的声学混淆问题,并验证了该方法在性能上能与人类听辨水平对齐。
该论文提出了一种名为条件期望奖励(CER)的新方法,利用大语言模型自身作为隐式验证器,通过计算生成答案对参考答案的条件似然期望来提供软性奖励信号,从而克服了传统基于规则验证器在自由形式答案领域应用受限的问题,显著提升了大模型在数学及通用推理任务中的表现。
本文提出了一种基于神经网络“活跃路径”的新型可解释方法,用于检测并消除机器学习中难以察觉的恶意后门,并通过在入侵检测模型中注入后门进行了实验验证。
本文提出了基于抽象解释的 FAME 方法,通过设计专用扰动域和结合 LiRPA 界限,首次实现了在大型神经网络中生成规模更小且无需遍历顺序的形式化抽象最小解释,并引入结合对抗攻击与 VERIX+ 的评估流程验证了其质量与效率。
该论文提出了一种名为 STA-GNN 的时空注意力图神经网络,通过动态建模工业控制系统中物理过程与通信模式的依赖关系,结合注意力机制实现可解释的异常检测,并引入保形预测策略以应对环境漂移和误报问题,从而提升关键基础设施安全监控系统的可靠性。
该研究提出了一种结合奇异值分解(SVD)与浅层递归解码器(SHRED)神经网络的全数据驱动框架,仅需三个传感器的温度测量值即可准确重构磁流体动力学(MHD)系统的完整时空状态,从而为核聚变中的多物理场问题提供了一种适用于实时监测与控制的高效代理建模策略。
本文提出了名为“收缩与征服”(CAC)的黑盒对抗攻击方法,该方法通过知识蒸馏和搜索空间精确收缩,在理论上证明了能在固定迭代次数内生成对抗样本,并在 ImageNet 数据集上超越了现有最先进方法。
本文提出了 EvoSchema 基准,通过引入涵盖十种列级和表级扰动的新颖模式演化分类法,系统评估并提升了文本转 SQL 模型在真实世界数据库模式动态变化下的鲁棒性。
本文提出了流形上的黎曼平均流(RMF)方法,通过利用平行输运构建平均速度场并采用对数映射表示,实现了无需数值积分的流形生成模型单步采样,在球面、环面和 SO(3) 等数据集上显著降低了采样成本并提升了生成质量。
本文提出了一种名为“采样与搜索”的高效算法,通过引入预测器预处理和高维采样策略,显著降低了学习增强型-均值聚类问题的计算复杂度并改善了聚类成本。
本文提出了 CacheSolidarity 系统,通过动态监控并选择性隔离可疑的跨租户前缀缓存共享,在有效防御大语言模型多租户服务中自动前缀缓存(APC)引发的时序侧信道攻击的同时,避免了现有防御方案因完全隔离用户而导致的性能损失,实现了高达 70% 的缓存复用率提升和 30% 的推理延迟降低。
该论文通过对比蒙特卡洛 Dropout 与共形预测两种方法在 Fashion-MNIST 数据集上的表现,指出尽管 H-CNN VGG16 精度更高但存在过度自信问题,而 GoogLeNet 校准性更优且共形预测能提供统计保证的预测集,从而强调了在深度学习系统中超越准确率、重视可靠性与不确定性评估的重要性。
该论文针对数据泄露问题,提出了一种将监督学习生命周期分解为 7 个核心原语并施加运行时硬约束的结构化语法方案,通过强制性的评估边界在调用时自动拒绝选择泄露和记忆泄露,从而有效防止了文档指南无法解决的常见失败。
本文提出了 CUPID 框架,这是一种无需修改或重新训练基础模型即可灵活插入任意层、同时估计偶然性和认知性不确定性的通用插件模块,旨在提升高风险领域 AI 决策的透明度与可信度。
该论文提出了一种基于自编码器的深度随机化分布式函数计算(DeepRDFC)框架,旨在利用数据样本最小化模拟分布与未知目标分布之间的总变差距离,从而在公共随机性受限的场景下,实现相比传统数据压缩方法更显著的通信负载增益和函数计算性能。
该论文提出了一种利用物理不可克隆函数(PUF)将神经网络模型权重与特定硬件唯一属性绑定的方法,从而确保模型仅在原始硬件上能保持高精度运行,有效防止了知识产权在克隆硬件上的非法复制。
该论文提出了一种名为 Sign-Prioritized FL (SP-FL) 的新型无线联邦学习框架,通过优先传输梯度符号并基于数据包与设备层面的重要性差异进行分层资源分配,有效解决了无线资源受限下的通信不可靠问题,显著提升了模型训练精度。
该论文提出了一种融合动力学机制的深度学习框架,通过自适应低维子空间高效计算瞬态不稳定性特征作为可解释前兆,并利用 Transformer 模型显著提升了高维混沌系统中极端事件的长时预测能力。