Conformal prediction for high-dimensional functional time series: Applications to subnational mortality

Each language version is independently generated for its own context, not a direct translation.

这篇文章主要讲的是：如何给未来的“不确定性”画出一个更靠谱的“安全圈”。

想象一下，你是一位精明的气象预报员，或者是一位负责给国家人口做规划的“算命先生”。你手里有一大堆数据（比如日本和加拿大各个地区、不同年龄、不同性别的死亡率曲线），你想预测未来会发生什么。

传统的做法就像是在玩“猜谜游戏”：你必须先假设一个完美的数学模型（比如假设天气总是按某种固定规律变化），然后基于这个模型去猜未来。但问题在于，现实世界很调皮，模型往往是错的（模型设定错误）。一旦模型错了，你算出来的“安全圈”（预测区间）就不准了，要么圈太大（浪费资源），要么圈太小（漏掉风险）。

为了解决这个问题，作者 Shang Han Lin 提出了一种**“不依赖模型”的新方法**，叫做**“共形预测”（Conformal Prediction）**。

为了让你更容易理解，我们可以把这两种新方法比作两种不同的**“画圈策略”**：

1. 核心概念：什么是“共形预测”？

想象你在玩飞镖。

传统方法：先研究飞镖的飞行物理公式，算出它应该落在哪里，然后画个圈。如果公式错了，圈就画歪了。
共形预测：不管飞镖飞行的物理公式是什么，我们只看过去的飞镖落在哪里。
- 我们看过去 100 次飞镖，有 95 次都落在了某个范围内。
- 那么，我们就很有信心地说：下一次飞镖，也有 95% 的概率会落在这个范围内。
- 关键点：这种方法不需要知道飞镖是怎么飞的（模型无关），也不需要假设飞镖的分布（分布无关），它只相信过去的经验数据。

2. 两种“画圈”的战术

文章比较了两种具体的战术，用来处理这种“高维功能时间序列”（听起来很吓人，其实就是指成千上万条随时间变化的曲线，比如日本 47 个都道府县、不同年龄、不同性别的死亡率曲线）。

战术 A：分块训练法（Split Conformal Prediction）

比喻：就像**“考前模拟考”**。
做法：
1. 把历史数据切成三块：学习区（训练集）、模拟考区（验证集）、真考区（测试集）。
2. 在“模拟考区”里，我们试着调整参数，看看画多大的圈才能覆盖 95% 的正确答案。
3. 确定好圈的大小后，再去预测“真考区”。
缺点：就像学生把一部分时间花在模拟考上，导致真正考试时，用来复习的时间变少了。特别是当你要预测很久以后（比如 10 年后）的情况时，因为“模拟考”的数据不够多，画出来的圈可能太窄了，容易漏掉真实情况（覆盖不足）。

战术 B：连续更新法（Sequential Conformal Prediction）—— 作者推荐

比喻：就像**“老司机边开边学”**。
做法：
1. 不需要专门留一块数据做“模拟考”。
2. 每过一天，拿到新的真实数据，就立刻把它加进经验库，重新调整一下“安全圈”的大小。
3. 它像是一个聪明的自动驾驶系统，随着路况（新数据）的变化，实时调整预测的边界。
优点：
- 不用浪费数据：所有数据都能用来学习。
- 更保守、更靠谱：它倾向于把圈画得稍微大一点点（哪怕稍微有点浪费），以确保绝对不会漏掉真实情况。
- 结果：在测试中，这种方法画出的“安全圈”虽然稍微宽一点，但准确率更高，而且综合评分（既考虑了准不准，也考虑了圈的大小）是最好的。

3. 他们是怎么验证的？

作者用了日本（1975-2023 年）和加拿大（1950-2016 年）的死亡率数据来做实验。

这些数据非常复杂：有 47 个地区，每个地区有男有女，每个性别有从 0 岁到 100 多岁的曲线。
他们把数据拆解开（用一种叫“方差分析”和“因子模型”的数学工具，就像把一团乱麻理成清晰的线条），然后分别用上述两种战术去预测未来。

4. 结论是什么？

分块训练法（战术 A）：在预测短期时还行，但预测长期时，容易过于自信（圈画得太小），导致实际死亡率跑出了圈外。
连续更新法（战术 B）：虽然有时候圈画得稍微大了一点点（稍微保守），但它极少出错。在统计学里，“宁大勿小”（宁可多算一点风险，也不要漏掉风险）通常是更好的策略。

总结

这篇文章告诉我们，在面对复杂、多变且数据量巨大的未来预测（如人口死亡率、股票曲线、气温变化）时，不要死守复杂的数学模型。

与其费劲去猜未来的物理规律，不如利用“连续更新”的智慧，让预测系统随着新数据的到来不断自我修正。这种方法就像给未来穿了一件**“防弹衣”**，虽然可能有点重（区间稍微宽一点），但能确保你在面对未知的风险时，绝对安全。

一句话总结：别猜未来，跟着过去走，并且每走一步就调整一次你的“安全网”，这样最稳妥。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于 Han Lin Shang 论文《高维函数时间序列的共形预测：在次级国家死亡率中的应用》（Conformal prediction for high-dimensional functional time series: Applications to subnational mortality）的详细技术总结。

1. 研究背景与问题 (Problem)

核心挑战：在随机函数或对象的时间序列建模与预测中，量化预测不确定性是一个基本问题。传统的统计方法通常依赖特定的统计模型来构建预测区间（Prediction Intervals, PIs）或预测带，但这些方法容易受到模型误设（model misspecification）、选择偏差以及有限样本有效性的限制。
现有方法的局限：虽然自助法（Bootstrapping）可以缓解部分问题，但其计算成本高昂。此外，现有的函数时间序列文献多关注固定数量的时间序列，而现实中（如气候学、金融学、人口学）常出现高维函数时间序列（HDFTS），即横截面数量（ $N$ ，如地区、股票）往往超过时间序列长度（ $T$ ）。
研究目标：针对 HDFTS，提出一种模型无关（model-agnostic）且分布自由（distribution-free）的方法，以构建具有可靠覆盖率的预测区间，并量化预测不确定性。

2. 方法论 (Methodology)

本文提出并比较了两种共形预测（Conformal Prediction）变体，应用于日本和加拿大的次级国家（省/州）分年龄、性别的对数死亡率数据。

2.1 数据预处理与分解

数据源：日本（1975-2023，47个都道府县）和加拿大（1950-2016，12个省份/地区）的分年龄、性别死亡率数据。
平滑处理：使用惩罚回归样条（penalized regression spline）对原始数据进行平滑，处理测量误差和缺失值，生成平滑的函数 $Y_t(u)$ 。
数据分解：为了处理高维特性，采用两种无损分解方法：
1. 单向函数方差分析 (One-way Functional ANOVA)：将数据分解为总效应、行效应（地区效应）和时变误差项。使用函数中值抛光 (Functional Median Polish) 算法进行鲁棒估计。
2. 函数因子模型 (Functional Factor Model)：基于 Leng et al. (2026) 的统一因子模型框架，将高维数据分解为低维潜在因子和因子载荷函数。通过特征值分析估计因子数量 $q$ 和因子得分。

2.2 共形预测方法

文章重点研究了两种构建预测区间的方法：

分割共形预测 (Split Conformal Prediction)：
- 原理：将数据划分为训练集、验证集和测试集。
- 流程：利用训练集生成预测，在验证集上计算残差函数，并校准调优参数（如标准差倍数或分位数），使经验覆盖率匹配名义覆盖率（如 95%）。
- 局限：需要牺牲部分数据作为验证集，且在长预测步长下，验证集数据量不足可能导致校准不佳。
序列共形预测 (Sequential Conformal Prediction)：
- 原理：无需独立的验证集，通过自回归过程（Autoregressive Process）动态更新预测分位数。
- 流程：利用历史绝对残差，通过分位数回归（Quantile Regression）拟合滞后项，预测下一时刻的绝对残差分位数。
- 优势：随着新数据到来自动调整，无需参数校准，避免了数据分割带来的信息损失。

2.3 评估指标

经验覆盖率 (ECP)：预测区间包含真实值的比例。
覆盖率差异 (CPD)：ECP 与名义覆盖率（如 0.95）的绝对差值。
区间得分 (Interval Score)：结合覆盖率（Coverage）和区间宽度（Sharpness）的综合评分。得分越低，预测质量越高。

3. 主要结果 (Key Results)

基于日本和加拿大数据的实证分析（1-10步预测）显示：

分割共形预测的表现：
- 倾向于低估覆盖率（Underestimation），即 ECP 通常低于名义水平（如 95%）。
- 随着预测步长（ $h$ ）增加，由于验证集数据量减少，校准效果变差，导致覆盖率进一步下降。
- 在分割方法中，使用标准差作为摘要统计量通常优于使用分位数。
序列共形预测的表现：
- 倾向于高估覆盖率（Overestimation），即 ECP 略高于名义水平（保守估计）。
- 区间得分更低：尽管覆盖率略高，但其生成的预测区间更窄且覆盖更稳定，因此在综合评分（Mean Interval Score）上表现最佳。
- 在长预测步长下，序列方法保持了较好的稳定性，未出现分割方法那样的性能急剧下降。
对比结论：
- 在相同的显著性水平下，略微高估覆盖率（保守）比低估覆盖率更有利。
- 序列共形预测在有限样本下提供了更优的预测区间，因为它不需要验证集校准，且能自适应更新。

4. 关键贡献 (Key Contributions)

首次应用：据作者所知，这是首次在高维函数时间序列（HDFTS）设置下研究预测不确定性量化的工作。
方法创新：将分布自由的共形预测框架引入 HDFTS 领域，并详细比较了分割式和序列式两种策略。
实证验证：利用日本和加拿大两个国家的次级国家死亡率数据进行了广泛的实证分析，证明了序列共形预测在处理高维、复杂依赖结构数据时的优越性。
开源复现：提供了完整的代码库，支持基于日本和加拿大数据的区间预测误差计算，促进了研究的可复现性。

5. 意义与展望 (Significance & Future Work)

实际意义：为人口学家、精算师和政策制定者提供了一种更稳健的工具，用于评估未来死亡率的不确定性，从而更好地规划养老金、医疗资源等。
理论意义：证明了在无需强模型假设的情况下，通过共形预测可以有效处理高维函数数据的预测区间构建问题。
未来扩展方向：
1. 残差建模：在序列共形预测中，目前使用自回归过程建模绝对残差，未来可尝试其他时间序列模型。
2. 联合建模：目前男女数据是分开建模的。未来可尝试构建包含年龄、年份、地区和性别的三维数组模型，利用双向函数方差分析（Two-way Functional ANOVA）结合因子模型来处理更复杂的交互效应。

总结：该论文提出了一种基于序列共形预测的稳健框架，有效解决了高维函数时间序列预测中的不确定性量化问题。研究表明，相比于传统的分割方法，序列共形预测在有限样本下能提供覆盖更准确、区间更紧凑的预测结果，特别适用于人口死亡率等关键领域的长期预测。