Invariance-Based Dynamic Regret Minimization
本文针对随机非平稳线性多臂老虎机问题,提出了一种名为 ISD-linUCB 的算法,该算法通过假设奖励模型可分解为平稳与非平稳分量,利用历史数据学习其中的不变性特征,从而在快速变化的环境中降低问题维度并显著减少动态遗憾。
335 篇论文
本文针对随机非平稳线性多臂老虎机问题,提出了一种名为 ISD-linUCB 的算法,该算法通过假设奖励模型可分解为平稳与非平稳分量,利用历史数据学习其中的不变性特征,从而在快速变化的环境中降低问题维度并显著减少动态遗憾。
本文提出了一种结合分层贝叶夫框架、最大边际likelihood估计及自适应代理模型(如FNO和PINN)的联合推断方法,旨在利用多系统数据同时估计个体参数并学习共享的未知动力学闭合项,从而高效解决ODE和PDE中的逆问题。
本文针对分组多臂赌博机中每个臂由多个独立属性组成且需满足所有属性均值高于阈值的可行性约束问题,推导了误差概率下界并提出了最优的可行性约束连续拒绝(FCSR)算法,该算法在固定预算下能有效识别最优可行臂并保证可行性。
本文提出了一种针对 Max-Plus 神经网络的稀疏次梯度算法,通过利用其代数结构固有的次梯度稀疏性并优化最坏样本损失,实现了比标准反向传播更高效的参数更新,同时保留了理论保证。
该论文提出通过在稀疏自编码器中引入权重正则化(特别是 L2 惩罚),结合特定初始化与约束策略,显著提升了特征在不同随机种子下的稳定性与可 steer 性,同时使基于文本的特征解释与功能可控性之间的关联更加紧密。
该论文通过似然视角研究了广义均值在密度聚合中的应用,证明了仅当阶数时(涵盖线性与几何平均),聚合策略才能系统性地优于个体分布,从而为深度集成学习中广泛使用的聚合方法提供了理论依据。
本文提出了名为潜在空间分布匹配(LSDM)的新框架,通过两阶段方法利用成对和非成对数据在低维潜在空间中匹配联合分布,从而在减少成对样本依赖的同时提升生成质量,并从理论上揭示了其与潜在扩散模型(LDMs)的内在联系。
PTOPOFL 提出了一种利用持久同调生成的 48 维拓扑特征向量替代梯度进行通信的隐私保护个性化联邦学习框架,通过拓扑引导的聚合策略在显著降低数据重构风险的同时,有效解决了非独立同分布数据下的模型聚合难题并实现了最优性能。
该研究提出了量子神经网络的几何设计原则,通过引入几乎完全局部选择性(aCLS)准则,指出实现有效特征学习需具备数据与权重联合依赖的可控几何变形能力,从而将设计重点从状态可达性转向可学习的隐藏表示几何结构。
该论文提出了一种受非平衡热力学启发的去噪扩散概率模型,通过结合去噪得分匹配与朗之万动力学的加权变分界进行训练,在 CIFAR10 和 LSUN 数据集上实现了当时最先进的图像生成质量。
该论文通过实证研究揭示了语言模型性能与模型规模、数据集大小及计算量之间遵循幂律关系,并据此提出了在固定计算预算下,应优先训练超大模型并在收敛前停止以实现最优计算效率的策略。
该论文提出了一种通过对抗过程同时训练生成模型和判别模型的新框架,利用极小极大博弈使生成模型无需马尔可夫链或近似推理网络即可有效捕捉数据分布。
该论文提出了一种随机变分推断与学习算法,通过重参数化技巧使变分下界估计器能够利用标准随机梯度法进行优化,从而在连续潜变量后验分布难以处理且数据规模巨大的情况下实现高效的推断与学习。