Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

本文提出并评估了多种基于排斥性节点(如行列式点过程和排斥过程)的蒙特卡洛积分方法以计算高维球面上的切片 Wasserstein 距离,并通过方差分析揭示了 UnifOrtho 估计量在大维数下的优势,最终建议在小维数场景使用随机拟蒙特卡洛法,而在大维数场景使用 UnifOrtho 方法。

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

该论文提出了一种名为 AffPCL 的新型个性化协同学习框架,通过精心设计的偏差校正与重要性校正机制,在无需预先知晓系统异质性水平的情况下,实现了从同质环境下的线性加速到异质环境下的独立学习基线之间的自适应平滑过渡,并揭示了即使在高度异质条件下协作仍能获得线性加速的新见解。

Chenyu Zhang, Navid AzizanWed, 11 Ma🤖 cs.LG

Robust Assortment Optimization from Observational Data

本文提出了一种基于观测数据的鲁棒 assortment 优化框架,通过建模客户偏好分布偏移并最大化最坏情况下的预期收益,在理论界定了计算可行性与样本复杂度上下界的同时,揭示了实现样本高效鲁棒学习所需的最小数据条件“鲁棒单项覆盖”,从而弥合了鲁棒性与统计效率之间的差距。

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose BlanchetWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

本文研究了非矩形平均奖励鲁棒马尔可夫决策过程,证明了在弱通信假设下存在实现次线性期望遗憾的鲁棒最优策略,揭示了其鲁棒值的极小极大表示,并指出平均奖励最优性可能掩盖极差的瞬态表现,进而提出了一种结合最坏情况最优策略、序贯检验与在线学习回退机制的基于时段的策略,以实现常数阶的瞬态值。

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

本文提出了一种基于物理信息神经网络(PINN)的框架,能够仅利用部分电压观测数据,在强非线性和多尺度动力学条件下,鲁棒且准确地重建神经元模型中的隐藏状态变量并推断生物物理参数,有效克服了传统数值方法在初始猜测敏感和收敛失败方面的局限。

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

本文提出了一种基于通用最不利子模型的核去偏插件估计量(ULFS-KDPE),该方法通过在再生核希尔伯特空间中构建自适应去偏流,无需显式推导或计算有效影响函数即可在标准正则条件下实现非参数模型中路径可微参数的半参数效率估计,并具备坚实的泛函分析基础与良好的数值稳定性。

Haiyi Chen, Yang Liu, Ivana MalenicaWed, 11 Ma🤖 cs.LG