Towards Reliable Simulation-based Inference
这篇论文探讨了基于模拟的统计推断中机器学习近似导致的过度自信问题,并提出了“平衡”正则化方法和针对该场景定制的贝叶斯神经网络两种解决方案,以增强推断结果的可靠性与校准性。
309 篇论文
这篇论文探讨了基于模拟的统计推断中机器学习近似导致的过度自信问题,并提出了“平衡”正则化方法和针对该场景定制的贝叶斯神经网络两种解决方案,以增强推断结果的可靠性与校准性。
本文提出了一种在主要可忽略性假设下估计和处理异质性主要因果效应(包括二元处理与二元中介变量情形)的框架,开发了具有不同稳健性特征的多种估计量并建立了大样本理论,同时利用 Camden Coalition 热点干预试验展示了该方法在估计异质性依从者效应中的应用。
本文提出了一种基于经验分布和距离函数子水平集构建模糊集的鲁棒马尔可夫决策过程(RMDP)框架,通过连接弱收敛与距离收敛,证明了该方法在有限样本下能提供高概率的出样本性能上界及收敛速率,并指出相比之下传统的经验 MDP 无法保证此类有限样本性能。
本书将生成式人工智能重新诠释为统计框架下的高维概率分布非参数学习方法,以流匹配为核心,通过正交化和交叉拟合等技术,将缺失值填补、反事实分析及分布动力学等任务转化为可解释且具备统计推断有效性的科学问题。
该论文通过康特 - 阿什比好调节器定理,验证了因果不变超图基底中的持久观察者具备内部模型,进而推导出自然梯度下降作为唯一学习规则,并建立了沃尔夫拉姆超图物理与万丘林神经宇宙学之间的联系,同时指出了其关于收敛参数预测的模型依赖性。
本文提出了一种新的分布式专家问题协议,通过优化通信量实现了比先前工作更优的遗憾界。
本文提出了一种基于可逆性约束的通用生成采样框架,通过最小化前向与后向马尔可夫轨迹间的最大均值差异(MMD)并仅依赖能量评估,成功解决了连续、离散及混合变量复杂分布的采样难题。
该论文提出了一种基于最优传输的分布无关转导泛化界,通过计算编码特征分布间的 Wasserstein 距离,不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界,还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。
本文填补了高斯过程汤普森采样(GP-TS)在后悔界分析上的空白,通过证明其下界、二阶矩上界以及期望温和后悔界,并放宽了时间视界 上累积后悔上界的推导条件,从而建立了多项式依赖 的后悔下界及改进的累积后悔上界。
该论文基于高斯比较定理,建立了机器学习训练动力学与更易分析的对偶动力系统之间的非渐近联系,不仅严格证明了动态平均场理论在渐近场景下的有效性,还提出了一种迭代细化方案以在有限样本域中引入涨落参数从而获得更精确的训练演化描述。
本文提出了一种名为鲁棒正则化策略迭代(RRPI)的新方法,通过将离线强化学习建模为在转移不确定性下的鲁棒策略优化问题,利用 KL 正则化将不可解的双层优化转化为可处理的单目标问题,从而在 D4RL 基准测试中实现了优于现有基线的性能并有效避免了分布外状态下的不可靠动作。
本文提出了变分混合专家路由(VMoER)框架,通过将贝叶斯推理限制在专家选择阶段,在几乎不增加计算成本的情况下,显著提升了大规模混合专家模型在不确定性量化、路由稳定性及分布外检测方面的表现。
本文提出了 BRACE 算法,旨在解决带有不合规(Noncompliance)的 Bandit 问题中推荐福利与直接控制治疗目标不一致的矛盾,通过参数化相位倍增策略实现 IV 逆运算的矩阵认证与诚实结构区间估计,从而在保障统计有效性的同时,根据上下文同质性等条件灵活识别最优推荐或治疗策略。
该论文针对传统三角最大过滤图(TMFG)在处理大规模数据时因需预计算稠密相关矩阵而面临的内存与运行效率瓶颈,提出了一种结合 k 近邻图与按需估算缺失相关性的近似算法(a-TMFG),从而实现了在百万级观测数据集上高效构建用于机器学习任务的稀疏图结构。
本文提出了一种基于 MM 算法的统一框架,用于在 Tweedie 和负二项分布等更广泛的噪声假设下推导传统及凸非负矩阵分解(NMF)的乘性更新规则,并通过实证研究验证了该框架在处理过离散数据及大规模类别场景下的优越性。
该论文报告了一种名为“ murmurations"( murmurations)的全新算术现象,它通过机器学习可解释性工具在大规模算术数据中发现,并揭示了其与 Frobenius 迹、Birch 和 Swinnerton-Dyer 猜想及随机矩阵理论之间的深刻联系。
本文针对基于二阶常微分方程的神经振荡器,利用 Rademacher 复杂度框架推导了其泛化误差上界,证明了误差随网络规模和时长呈多项式增长且可通过正则化约束提升泛化能力,并通过 Bouc-Wen 非线性系统的数值实验验证了理论结果。
本文提出了一种基于高斯过程的统一分层多任务多保真度(H-MT-MF)框架,通过联合建模任务间相似性与保真度依赖性,有效解决了制造系统代理建模中数据需求大及多源异构数据利用不足的问题,显著提升了预测精度。
该论文通过引入具有层可组合性的均值归一化算子范数,将 AdamW 和 Muon 等优化器统一为矩阵算子范数下的最速下降法,从而提出了能实现宽度无关平滑度保证及跨宽度超参数迁移的 MOGA 优化器,并在 GPT-2 和 LLaMA 的大规模预训练中展现出比 Muon 更优的效率与稳定性。
本文提出了两种基于神经网络和在线学习的变化点检测方法,它们具有线性计算复杂度,在合成及真实数据集上的实验表明其性能优于现有方法,并证明了算法的收敛性及其在特定条件下优于离线方法的优势。