stat 篇论文 | Gist.Science

本文提出了一种名为稀疏凸双聚类（SpaCoBi）的新型凸优化方法，该方法通过基于稳定性的调优准则，有效地解决了高维数据集中的噪声和计算挑战，并证明了其与现有最先进的双聚类技术相比具有更优越的准确性和鲁棒性。

本文表明，在回归模型中将复合质量评分作为协变量会引入循环论证偏差，从而系统性地削弱结构性预测因子的估计效应，这一方法论风险已通过 CMS 医院再入院数据和蒙特卡洛模拟得到了证实。

本研究表明，感知的资源稀缺性会增加冒险决策行为，特别是在高客观风险条件下，通过层级漂移扩散模型揭示，这种现象表现为向冒险选项的漂移率加速。

本文提出了一个用于医疗保险支付完整性的可解释、可复现的公共数据框架，该框架通过整合排序聚合异常集成和符合性成本参考带，在优先处理审计分流的同时，将统计异常与违规行为证据区分开来。

本文为数学教育研究引入了一种基于中位数的效应量指标，通过将组值与中位数进行比较，该指标为科恩的 d 提供了一个更具直观性且更稳健的替代方案，从而降低了对偏态分布、离群值和小样本量的敏感性，同时更好地契合了对学生表现的实际解释。

本文介绍了 HAIB-MEC 框架，这是一种结合了非线性预测建模与层次化不确定性修正的混合机器学习-贝叶斯系统，旨在显著提高受测量误差影响的健康数据集的准确性、减少偏差并增强可靠性。

本文引入了无意义依赖指数（Nonsense Dependence Index, NDI），这是一种基于秩的简单诊断指标，定义为肯德尔 $\tau$ 与 Bergsma–Dassios $\tau^*$ 的平方根之差，旨在有效区分由共同趋势或外部因素驱动的伪相关与真实的单调关系。

本研究比较了用于预测印度尼西亚保险综合收益的 SARIMA 和 LSTM 模型，发现虽然 SARIMA 能更好地捕捉季节性趋势，但两种模型都表现出有限的准确性，这表明需要未来的混合方法和外部变量来提高预测性能。

本研究评估了倾向评分逆概率加权（PS-IPW）和多重插补（MI）在处理坦桑尼亚一项肺结核-艾滋病联合补充治疗试验中单调缺失数据时相对于完全病例分析的表现，发现虽然这两种先进方法在偏差和效率方面均优于传统分析，但均未显示出具有统计学意义的治疗效应。

本研究提出并验证了一种用于预测巴西法定亚马逊地区疟疾发病率的贝叶斯时空贝尔模型，证明了该模型在识别高风险微观区域以及为有效公共卫生监测提供时机方面，其性能优于传统的泊松模型和负二项分布模型。