Approximate Bayesian inference for cumulative probit regression models
本文针对累积概率回归模型在大数据场景下贝叶斯推断计算效率低的问题,提出了三种基于变分贝叶斯和期望传播的可扩展近似算法,并通过模拟与犯罪网络案例研究证明了其在保持高精度的同时显著优于传统马尔可夫链蒙特卡洛方法的计算性能。
222 篇论文
本文针对累积概率回归模型在大数据场景下贝叶斯推断计算效率低的问题,提出了三种基于变分贝叶斯和期望传播的可扩展近似算法,并通过模拟与犯罪网络案例研究证明了其在保持高精度的同时显著优于传统马尔可夫链蒙特卡洛方法的计算性能。
本文系统评估了 GPT 和 Gemini 等大语言模型在构建二水平部分因子设计方面的能力,结果表明这些模型能够有效生成多达 8 个因子的 8、16 和 32 次试验的最优设计。
本文提出了一种结合贝叶斯后验分布的两阶段方法,通过将第一阶段模型估计的不确定性纳入第二阶段亚组治疗效应推断,解决了数据驱动亚组分析中常忽视估计不确定性的问题,从而在模拟和新冠临床试验中实现了更准确的置信区间校准。
该研究通过模拟实验量化了忽略可逆动态所导致的误差,证明在特征获取的相对顺序和演化路径核心结构推断上,基于不可逆假设的演化积累模型(EvAMs)在多数情况下仍能提供可靠且具信息量的近似结果,尽管其在不确定性估计和特征交互分析方面存在较大误差。
该论文指出传统基于状态伪随机数生成器的“公共随机数”方法因执行路径依赖导致因果结构不连贯,并提出结合基于计数器的随机数生成器与事件标识符的解决方案,以通过事件索引恢复随机数生成的因果一致性。
本文提出了名为 CausalTimePrior 的框架,通过生成包含观测与干预数据的合成时序结构因果模型,解决了现有基准缺乏干预目标的问题,从而使得先验数据拟合网络(PFNs)能够作为基础模型应用于时序因果推断。
该论文提出了一种基于划分的函数型岭回归框架,通过将系数函数分解为不同分量并实施差异化惩罚,有效解决了高维函数型线性模型中的多重共线性与过拟合问题,在提升数值稳定性与可解释性的同时实现了偏差与方差的最优权衡。
本文通过构建由泊松测度和布朗运动驱动的连续时间随机模型,重新审视了 Schnieper 的索赔准备金分解框架,并提出了一种能够自然处理非对称性、非负性及内在边界约束的自助法,以估算索赔准备金的完整预测分布。
本文提出了一种名为“外伸”(outrigger)的局部多项式估计量,通过利用条件得分函数估计和扩展数据窗口,在无需独立性或对称性等结构假设的情况下,实现了对不同条件误差分布的自适应,并证明了其在 Hölder 类上的极小极大最优性。
该论文提出了一种名为 wcPCA 的统一框架,用于解决多域数据分布偏移下的主成分分析最坏情况优化问题,并证明了其在源域及目标域凸包内的最优性、一致性以及向矩阵补全问题的扩展能力,实验表明该方法在显著改善最坏情况性能的同时仅轻微牺牲了平均性能。
该论文针对在缺失随机标签和空间依赖场景下使用机器学习预测值进行推断时,交叉拟合导致的方差估计失真问题,提出了一种结合双重稳健估计与自助法空间异质自相关一致(HAC)方差校正的新方法,从而实现了更稳健且渐近有效的置信区间。
该论文提出了一种基于半参数高斯 copula 模型的混合类型多变量功能主成分分析(FPCA)方法,用于处理移动健康数据中连续、截断、有序及二值等多尺度时间序列,并通过美国国家精神卫生研究所的一项研究验证了其在识别情绪障碍亚型共享时间模式及构建数字生物标志物方面的有效性。
该论文提出了一种基于贝叶斯优化的新型半模块推断方法,通过将 Copula 模型中的每个边缘分布视为独立模块并优化其影响参数,实现了对潜在错误设定边缘分布的鲁棒推断,从而克服了传统双模块方法在处理不同边缘分布不同程度的误设时的局限性。
本文提出了一种新颖的预测导向迁移学习框架,通过从源研究转移预测知识而非分布参数,利用灵活的半参数变换模型和 EM 算法,在无需访问源个体数据且放宽参数相似性假设的情况下,显著提升了目标研究(特别是事件数有限时)的生存分析预测性能。
该论文提出了一种名为动态贝叶斯回归分位数合成(DRQS)的新方法,通过引入非对称拉普拉斯分布和时变潜在因子结构(FDRQS),在贝叶斯预测合成框架下有效整合多模型的分位数信息,从而显著提升了包括极端经济压力时期在内的宏观变量分位数预测精度。
该论文提出了一种基于必要充分区间条件的序贯方法,用于生成具有指定度序列的二分、有向及无向图,并据此开发了适用于不同规模问题的枚举与采样算法,显著提升了在大规模实例下的可扩展性。
本文针对具有异质均值的随机向量求和方差估计问题,指出在双向聚类或弱依赖情形下标准估计量会因低估方差而导致检验过度,并提出了一种对异质均值稳健的保守方差估计量以恢复推断的有效性。
本文提出了一种基于密度幂散度损失函数与正则化的鲁棒联合建模框架,用于处理含连续和二元响应的数据,该框架通过高效算法在降维的同时有效抑制异常值影响,并在模拟与半导体制造案例中展现出优于现有方法的预测精度与稳健性。
该论文针对真实平台搜索行为分析场景,提出了一种在随机序约束下估计多个离散单峰分布的混合整数凸二次优化方法,实验表明该方法在小样本情况下能显著降低分布估计误差,而在数据充足时表现与现有方法相当。
本文在已有研究基础上,进一步推导了单位 Teissier 分布的阶统计量矩、L-矩及截断矩表征等理论性质,系统比较了包括最大乘积间距、多种距离度量及 L-矩在内的多种参数估计方法,并通过模拟研究与实际数据应用验证了该分布的灵活性与实用性。