Robust evaluation of treatment effects in longitudinal studies with truncation by death or other intercurrent events
该论文提出了一种名为“成对最后观测时间(PLOT)”的估计量,通过仅利用干预事件发生前的基线匹配数据来评估纵向研究中的治疗效果,从而在无需结构性假设且即使存在严重正性违反的情况下,为处理截断死亡等复杂干预事件提供了一种稳健且数据驱动的因果推断新方法。
252 篇论文
该论文提出了一种名为“成对最后观测时间(PLOT)”的估计量,通过仅利用干预事件发生前的基线匹配数据来评估纵向研究中的治疗效果,从而在无需结构性假设且即使存在严重正性违反的情况下,为处理截断死亡等复杂干预事件提供了一种稳健且数据驱动的因果推断新方法。
该论文提出了一种新颖的绝对聚类指标,通过定义簇的紧致性函数和簇间邻域点集来量化簇的紧致性与可分性,从而有效确定数据中的真实簇数量,并在多种数据集上验证了其优于传统相对指标的性能。
该研究通过放松对未观测混杂因素的强假设,利用线性规划和单调性方法推导了疫苗试验中不同疫苗效力估计量的非参数因果界,并探讨了不同因果结构下的界限差异及其在合成数据中的表现。
本文定义了基于随机样本的经验 Orlicz 范数作为总体 Orlicz 范数的自然估计量,在最小假设下推导了其大数定律并扩展至回归模型,同时给出了中心极限定理的充分条件,并揭示了在正态分布等特定情形下该范数具有非标准的 收敛速率及稳定分布极限,且证明了在一般情形下不存在统一的收敛速率。
该论文针对能源市场中连续发生的机制转换及现有方法缺乏因果解释的局限,提出了一种结合神经因果发现与多变量时序数据的增强型时间序列因果模型(ATSCM),旨在通过可解释的因子和动态因果图实现对电价形成机制的深入理解及反事实推理。
本文提出了一种结合变分自编码器与结构因果模型的时序神经因果模型(TNCM-VAE),通过引入有向无环图约束和因果 Wasserstein 距离,成功生成了既保留时间依赖性又符合因果机制的金融合成数据,从而显著提升了反事实概率估计的准确性并支持更可靠的金融压力测试与情景分析。
该论文将因果博弈扩展至序贯场景并证明其计算复杂性,但实证结果表明,在理性最佳响应假设下,序贯因果均衡并未带来比经典斯塔克尔伯格均衡更高的社会福利,从而揭示了基于理性选择的标准博弈框架与因果推理优势之间的根本性不兼容。
本文针对现实世界中普遍存在但研究较少的异质符号网络,提出了能够同时建模强平衡与弱平衡的符号块模型,并证明了其可识别性、开发了高效优化算法,且从概率估计和社区检测两个维度确立了模型的渐近一致性。
本文提出了一种基于最大风险最小化(MaxRM)原则的随机森林变体,通过设计高效算法并证明统计一致性,实现了在均方误差、负奖励和遗憾三种风险度量下的跨环境泛化,并针对遗憾风险给出了新分布下的泛化保证。
该论文通过构建已知真实后验的“贝叶斯风洞”环境,证实了小型 Transformer 能够以极高精度实现贝叶斯推理,并揭示其通过残差流作为信念基底、前馈网络执行更新以及注意力机制进行内容寻址的几何机制,从而在架构层面解释了 Transformer 优于 MLP 的推理能力。
该论文通过一阶分析揭示了交叉熵训练如何通过注意力分数的优势路由和值向量的责任加权更新,驱动注意力与内容协同专业化,从而在优化过程中塑造出支持贝叶斯推理的低维流形几何结构。
该论文提出了一种基于线性随机插值的概率流常微分方程的采样新方法,通过利用朗之万采样器高效生成中间分布样本并构建速度场估计器,实现了对未归一化玻尔兹曼分布的有效采样,并在理论上证明了收敛性,在数值实验中展现了处理高维多模态分布及贝叶斯推断任务的高效性。
本文提出了一种基于控制变量法的迁移学习新框架,用于解决隐私受限场景下的标量 - 函数回归问题,首次建立了其与偏移量迁移学习的理论联系,并推导了考虑离散观测平滑误差的收敛速率。
本文针对利用生成模型作为先验的贝叶斯逆问题,建立了最小化 Wasserstein-2 距离的生成先验误差定量界,证明了后验误差在特定假设下继承先验的 Wasserstein-1 收敛速率,并通过数值实验及椭圆偏微分方程逆问题验证了该理论分析的有效性。
本文提出了基于 Hahn 多项式激活函数的轻量级可解释模型 HaKAN,通过结合通道独立性、分块机制及 Hahn-KAN 模块,在长短期多变量时间序列预测任务中超越了现有的 Transformer 和 MLP 基线方法。
该论文提出了一种基于奇异贝叶斯神经网络的参数高效方法,通过将权重矩阵参数化为低秩分解形式,在显著减少参数量的同时实现了优于传统均值场方法的校准性、分布外检测能力及泛化性能。
该论文通过统计物理和动力学平均场分析,揭示了高维条件下无分类器引导(CFG)导致生成多样性的丧失源于一种相变,并据此提出了一种引入负引导窗口的理论驱动调度方案,以在保持类别可分性的同时缓解方差收缩问题。
该论文证明了在噪声仅具有有限四阶矩而非高斯分布的假设下,非对称秩一张量模型的最大似然估计量在渐近谱分布、奇异值及模式对齐等方面仍表现出与高斯情形一致的普适性。
该论文提出了一种基于 e-过程的统一框架,用于实现具有任意时刻有效性保证的在线大语言模型水印检测,并通过构建经验自适应 e-过程提升了检测功效。
本文提出了 SEED-SET 框架,这是一种基于贝叶斯实验设计的系统级伦理测试方法,它通过结合领域客观评估与利益相关者的主观价值判断,利用分层高斯过程建模和新型采集策略,有效解决了自主系统在高风险场景中伦理对齐评估的难题,并在测试候选生成效率与高维空间覆盖度上显著优于基线方法。