From Text to Forecasts: Bridging Modality Gap with Temporal Evolution Semantic Space

该论文针对文本与时间序列预测之间的模态鸿沟,提出了 TESS 方法,通过构建包含均值偏移、波动率等可解释时间原语的“时间演化语义空间”,将文本语义转化为数值信号,从而在多个真实数据集上将预测误差降低了高达 29%。

Lehui Li, Yuyao Wang, Jisheng Yan, Wei Zhang, Jinliang Deng, Haoliang Sun, Zhongyi Han, Yongshun Gong

发布于 2026-03-16
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 TESS 的新方法,旨在解决一个非常棘手的问题:如何把“文字描述”和“数字时间序列”完美地结合起来,从而更准确地预测未来?

想象一下,你是一位天气预报员

  • 数字时间序列就像是温度计、湿度计和气压表上跳动的具体数字。它们很精确,但有时候数字本身看不出为什么突然变冷了(比如,数字不会告诉你“刚才有一场寒流过境”)。
  • 文字信息就像是新闻标题或社交媒体上的描述(例如:“突发!强冷空气南下,气温骤降”)。这些文字很有用,但它们太“模糊”了,而且充满了无关的废话。

核心难题:两个世界“语言不通”

以前的方法就像让一个只懂数学的机器人直接去读新闻。

  1. 注意力分散:机器人读新闻时,容易被“今天天气真好”、“某明星发微博了”这些无关的废话(冗余信息)吸引,反而忽略了“气温骤降”这个关键信号
  2. 翻译失败:即使机器人读到了“气温骤降”,它也不知道这具体意味着温度会下降 5 度还是 10 度。文字是定性的(大概、可能),而预测需要定量的(具体数值)。这种“语言不通”导致预测效果很差。

解决方案:TESS —— 一个聪明的“翻译官”

论文提出的 TESS 方法,就像是在数字和文字之间建了一座**“翻译中转站”**(他们称之为“时间演化语义空间”)。

第一步:把“新闻”提炼成“专家简报”

TESS 不会直接把整篇新闻扔给预测模型。它先请一位超级聪明的 AI 翻译官(大语言模型 LLM) 来读新闻。
这位翻译官的任务不是复述新闻,而是把新闻里的关键信息提炼成四个具体的“时间演化原语”(就像四个核心指标):

  1. 均值偏移:整体水平是突然升高了还是降低了?(比如:气温是整体变高了)
  2. 波动性:变化是剧烈的还是平稳的?(比如:气温是忽高忽低,还是稳步下降)
  3. 形状:变化的趋势长什么样?(比如:是“先升后降”的山峰状,还是“持续下跌”的滑梯状)
  4. 滞后/衰减:影响是马上发生还是过一会儿才发生?是瞬间消失还是持续很久?

比喻:这就好比把一篇几千字的长篇大论新闻,浓缩成一张**“专家便签”,上面只写着:“注意!气温将大幅下跌**(均值偏移),过程剧烈(波动性),呈先急后缓(形状),且持续三天(滞后)。”

第二步:给“便签”加上“信任度评分”

大语言模型虽然聪明,但偶尔也会看走眼或产生幻觉。
TESS 引入了一个**“守门员”(置信度门控机制)**。

  • 如果翻译官提取的信息很确定(比如新闻明确说了“下降 10 度”),守门员就给它高分,让预测模型全力参考。
  • 如果翻译官拿不准(比如新闻模棱两可),守门员就给它低分,甚至直接忽略,防止错误的信息干扰预测。

比喻:这就像在听专家建议时,你会判断:“这位专家说话很有把握,我信他;那位专家好像有点含糊,我就当个参考,不全信。”

第三步:指导预测

最后,预测模型(负责看数字的)拿着这张经过筛选的“专家便签”,结合历史数字,就能做出更精准的预测了。

为什么这个方法很厉害?

  1. 去粗取精:它过滤掉了新闻里 99% 的废话,只留下对预测有用的核心逻辑。
  2. 化虚为实:它把模糊的文字描述(“大涨”、“暴跌”)转化成了模型能听懂的数学逻辑(均值、波动、形状)。
  3. 自我纠错:通过“信任度评分”,它防止了 AI 翻译官的胡言乱语影响最终结果。

实验结果

作者在四个真实世界的数据集上进行了测试(包括比特币价格股票数据电力消耗环境数据)。

  • 效果惊人:相比目前最先进的其他方法,TESS 将预测误差降低了最高达 29%
  • 特别擅长:在那些受突发事件影响大、数据不稳定的场景(比如股市崩盘、极端天气)中,效果提升最明显。

总结

简单来说,TESS 就是给冷冰冰的预测模型请了一位**“懂新闻的翻译官”。这位翻译官能把杂乱的文字新闻,翻译成模型能听懂的“数学指令”,并且自带“防忽悠机制”**,确保模型只听从靠谱的建议。这让机器在面对突发事件时,能像人类专家一样,结合“数据”和“新闻”做出更聪明的判断。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →