Quantifying Membership Disclosure Risk for Tabular Synthetic Data Using Kernel Density Estimators
该论文提出了一种基于核密度估计(KDE)的实用方法,通过建模合成数据与训练记录间的最近邻距离分布,在不依赖计算密集型影子模型的情况下,有效量化了表格合成数据中的成员披露风险,并实现了比现有基线更优的风险评估效果。
96 篇论文
该论文提出了一种基于核密度估计(KDE)的实用方法,通过建模合成数据与训练记录间的最近邻距离分布,在不依赖计算密集型影子模型的情况下,有效量化了表格合成数据中的成员披露风险,并实现了比现有基线更优的风险评估效果。
该论文提出了一种结合合作博弈论与限制联盟结构的“球员受限沙普利值”(PRS)框架,通过引入包含传球网络的“预期射门行动”(xGA)指标,在意大利足球甲级联赛数据中量化了球员在进攻射门动作中的协同贡献。
本文提出了一种基于贝叶斯合成似然(BSL)的改进型多层次网络 Meta 回归方法,通过利用亚组汇总数据并解决哈密顿蒙特卡洛(HMC)在随机梯度估计和非可微似然函数上的应用挑战,显著提升了在个体患者数据缺失情况下的治疗效果比较精度。
本文提出了一种基于混合频率模型的预测方法,旨在克服时间聚合导致的信息缺失问题,并通过 CAD/USD 汇率预测实证表明该方法在解决“梅斯 - 罗戈夫难题”方面优于现有方法。
该研究提出了一种整合个体追踪与种群分布数据的全年时变 Ornstein-Uhlenbeck 过程模型,通过联合分析金雕的迁徙轨迹与 eBird 相对丰度数据,实现了对种群时空动态的高效推断、风场风险预测及基于后期观测的早期来源回溯。
本文提出了一种基于概率积分变换数据三角矩的新颖拟合优度检验,通过充分利用三角统计量的协方差结构,使检验统计量在存在 nuisance 参数时仍收敛于 分布,并提供了涵盖 11 种常用连续分布族的统一实现方案,经模拟验证具有准确的显著性水平和强大的检验功效。
该论文提出了一种基于多中心汇总统计量的序贯聚类算法(CoC),通过多轮 Cochran 型检验与自助法重采样,在检验参数同质性的同时实现中心分组的准确恢复,并证明了其在大样本下以概率趋近于 1 恢复真实分组的理论性质。
该论文针对重症监护室长期床位规划中需求不确定性的挑战,提出了一种基于非平稳队列模型()和数据驱动的方法,通过结合时变到达率与实证拟合的住院时长分布,揭示了传统静态启发式规则在应对波动需求时的不足,并为新生儿重症监护室(NICU)的床位容量规划提供了更精准的决策支持。
该论文利用随机矩阵的集中不等式,为不确定参数下的电力网络导纳矩阵谱及经典线性潮流模型建立了保守概率界限,揭示了误差界与节点关键性的关联,并通过 IEEE 测试系统验证了其在捕捉谱扰动缩放行为方面的有效性。
该论文提出了一种对 Brier 分数中 Yates 协方差分解的直观代数重排,将其转化为方差失配、相关度不足和大尺度校准三个非负项,从而清晰揭示了完美概率预报需同时满足方差匹配、完全正相关及均值匹配的最优条件。
本文提出了一种适用于整群随机试验的两阶段自适应设计方法,通过结合组合检验、多阶段样本量重估及帕累托最优平衡策略,有效解决了因群内相关性参数不确定导致的试验成本高昂问题,并展示了其在阶梯楔形设计及 E-MOTIVE 试验重分析中的应用。
本文提出了行为分解线性动态系统(b-dLDS)模型,旨在从大规模神经活动中解耦与行为直接相关的动态子系统和并行内部计算,并在模拟数据及斑马鱼大规模神经记录中验证了其在识别行为相关动态连接网络方面的优越性。
该论文提出了一种将统计假设检验嵌入博弈策略的“先测试后惩罚”框架,通过允许忽略极小概率历史并采用序贯或分批测试机制,在 imperfect monitoring(不完美监控)条件下成功扩展了重复博弈的民间定理,证明了足够耐心的玩家可维持任意可行且个体理性的收益。
这项基于"All of Us"研究计划的数据分析表明,全膝关节和髋关节置换术患者术前活动量呈渐进性下降,术后呈现“快速改善—增速放缓—稳定”的三阶段恢复模式,且术前功能储备越高越有助于恢复至日常活动水平,凸显了长期可穿戴设备监测在优化围手术期管理中的价值。
本文提出了一种基于序贯马尔可夫链蒙特卡洛(SMCMC)技术的局部数据同化方案,通过两种利用观测空间稀疏性的新策略,在避免粒子滤波权重退化问题的同时,有效处理了高维非线性非高斯地理物理模型(包括 SWOT 和漂流浮标数据)中的重尾观测噪声,并展示了其优于局部集合变换卡尔曼滤波(LETKF)的性能。
本文提出了一种结合加法激发与乘法抑制的多元 Hawkes 过程模型,通过贝叶斯推断有效解决了多变量动物声学通信中激发与抑制的识别难题,并成功应用于分析群居猫鼬和两种须鲸的呼叫数据以揭示其复杂的交互模式。
本文作为面向冲击压缩领域的教程,介绍了一种基于贝叶斯线性回归和兰金 - 雨贡纽方程的两步法,用于从冲击波速度数据中生成多个与测量结果一致的压力 - 体积雨贡纽曲线,并展示了该方法在可解释性、计算效率及对异常值鲁棒性方面优于传统最小二乘法和自举法。
这篇综述系统概述了将患者协变量聚类与临床结局模型相结合的方法,区分了利用结局信息构建聚类的“知情”模型与仅基于协变量的“无偏”模型,并探讨了其在高维数据、风险分层及亚组治疗效应估计等临床场景中的应用。
该研究通过引入拓扑数据分析(TDA)提取步态中足部 clearance 的非线性结构特征,并结合随机森林分类器,显著提升了帕金森综合征(特别是特发性帕金森病与血管性帕金森病)的鉴别诊断准确率。
本文提出了一种利用稀疏精度结构的包裹高斯马尔可夫随机场(WGMRF)模型,以解决大规模空间方向数据(如海啸波浪方向)建模中传统包裹高斯过程方法计算效率低下的问题,并通过模拟与 2004 年印度洋海啸实例验证了其在预测性能和可扩展性上的优势。