OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack
本文提出了一种名为 OTAD 的新型两阶段最优传输诱导防御模型,通过结合最优传输正则化与凸积分问题求解,在确保局部 Lipschitz 连续性的同时实现对训练数据的精确拟合,从而在多种架构和数据集上展现出优于现有方法的鲁棒性。
5678 篇论文
本文提出了一种名为 OTAD 的新型两阶段最优传输诱导防御模型,通过结合最优传输正则化与凸积分问题求解,在确保局部 Lipschitz 连续性的同时实现对训练数据的精确拟合,从而在多种架构和数据集上展现出优于现有方法的鲁棒性。
该论文建立了基于小批量随机梯度下降优化的深度 Cox 模型中“小批量最大偏似然估计量”(mb-MPLE)的统计理论框架,证明了其一致性、最优收敛速率及渐近正态性,并提供了关于学习率与批量比等超参数调优的实用指导,从而解决了大规模数据下标准估计量难以计算的问题。
本文提出了一种结合退火重要性采样与变分推断的算法,通过重参数化证据下界并构建中间分布序列,有效解决了高维复杂数据下高斯过程潜在变量模型中提案分布难以生成的问题,从而实现了更紧的变分界、更高的对数似然及更稳健的收敛。
本文通过引入取值于任意度量空间 的核来定义 -网络,并构建了统一的 -Gromov-Wasserstein 距离框架,该框架不仅涵盖了许多已知变体,还证明了其具备度量性、可分性、完备性和测地性等优良性质,同时提供了适用于实际应用的计算下界与近似方法。
该研究通过对大量文献的综述和模拟实验,指出后验解释工具(如 SHAP 和 LIME)虽能解释模型预测,但因特征相关性和“拉什omon 效应”导致其难以可靠还原真实数据关系,因此警示商业研究不应将其用于假设验证,而应仅作为生成洞察的探索性工具。
本文通过建立公平的量化基准并引入包含数据移动开销的详细能耗模型,重新评估了脉冲神经网络(SNN)的能效,揭示了其在特定低脉冲率及中等时间步长条件下相比量化人工神经网络(QNN)具有显著能效优势,并指出优化后的 SNN 有望使智能手表的电池寿命翻倍。
该论文提出了一种新的耦合振荡器网络(CON)模型,通过赋予其拉格朗日系统结构、证明全局输入 - 状态稳定性并建立输入与潜在空间力的可逆映射,实现了基于原始像素反馈的机械系统高效潜在空间闭环控制。
本文提出了 xTED 框架,利用专门设计的扩散模型在数据层面直接对源域轨迹进行编辑以弥合跨域差距,从而在无需复杂模型架构的情况下显著提升目标域策略学习的性能。
本文提出了一种基于自举去噪能量匹配(BNEM)的新型玻尔兹曼采样器,该方法通过直接学习能量函数并结合自举技术平衡偏差与方差,在二维高斯混合模型和双势阱势等任务中展现了比现有方法更优越的性能和鲁棒性。
该论文针对具有通用状态和动作空间的有限时域马尔可夫决策过程,通过建立政策优化的聚克 - 洛雅斯维奇 - 库尔德卡(PŁK)条件,证明了策略梯度方法能在非凸景观下以非渐近速率收敛至全局最优策略,并首次为多周期库存系统和随机现金平衡问题提供了样本复杂度保证。
该论文提出了一种基于常时滞神经延迟微分方程(NDDEs)的框架,通过借鉴 Mori-Zwanzig 形式体系将隐藏变量转化为记忆项,从而在部分可观测条件下高效地学习非马尔可夫动力学系统。
该论文提出了 LS-Imagine 方法,通过构建长短期世界模型并模拟目标导向的跳跃状态转移,有效扩展了视觉强化学习智能体的想象视野,从而显著提升了 MineDojo 等开放世界环境中长程决策的探索效率。
该论文通过将动量 SGD 对抗训练视为离散时间动力系统并引入 PAC-Bayes 分析框架,从学习动态角度揭示了鲁棒过拟合的机制,并解释了鲁棒权重扰动在抑制损失曲率与优化效率之间的权衡。
该论文表明,在无需测试时梯度更新或显式系统模型的情况下,基于上下文学习的 Transformer 能够隐式推断隐藏状态,从而在从线性高斯到非线性等各种动态系统中实现媲美卡尔曼滤波及粒子滤波等经典方法的输出预测性能。
本文提出了一种名为自适应迁移聚类(ATC)的统一框架,该算法通过优化偏差 - 方差分解,能够在主数据集与辅助数据集存在未知差异的情况下自动利用共性,从而在包括高斯混合模型在内的多种统计模型中实现最优的聚类效果并量化迁移收益。
本文提出了一种用于求解双块非凸非光滑优化问题的学习近端交替最小化算法(LPAM)及其对应的可解释网络(LPAM-net),通过结合平滑技术、残差学习与块坐标下降策略证明了算法的收敛性,并在联合多模态 MRI 重建任务中展现了参数高效与优越的性能。
该论文提出了一种通过重建视觉基元来学习高层结构解释的神经符号系统,其在组织病理学图像异常诊断任务中不仅比传统深度学习架构具有更高的分类准确率,还具备更强的可解释性。
该论文提出了 Puppet-CNN 框架,通过将卷积层参数建模为受神经微分方程控制的连续动态系统,实现了根据输入复杂度自适应调整有效层数,从而在保持竞争力的同时显著减少了可训练参数。
该论文提出了一种输入自适应生成动力学框架,通过训练扩散模型适应不同的生成轨迹,使其能根据样本复杂度动态调整生成过程,从而在保持图像生成质量的同时减少平均采样步数。
本文提出了一种基于聚类分析的步态任务集优化策略,通过筛选最小且具代表性的任务组合来训练神经网络,在显著降低数据采集成本的同时,实现了与使用全量任务集相当的髋关节力矩估计精度。