TRACE: Temporal Rule-Anchored Chain-of-Evidence on Knowledge Graphs for Interpretable Stock Movement Prediction

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 TRACE 的新方法，用来预测股票是涨还是跌。

想象一下，传统的股票预测就像是一个人在看天气预报，只盯着“过去几天的气温”（历史股价）或者“今天的新闻标题”（情感分析）来猜明天会不会下雨。但现实中的股市更像是一个巨大的、复杂的社交网络，一家公司的命运往往取决于它的朋友、敌人、合作伙伴甚至整个行业的风吹草动。

TRACE 就像是一个拥有“侦探直觉”和“严格档案库”的超级金融侦探，它不再瞎猜，而是通过以下三个步骤来破案：

1. 建立“金融关系网” (知识图谱)

首先，TRACE 构建了一个巨大的动态关系地图。

传统做法：把每家公司当成孤岛。
TRACE 的做法：它把公司、产品、人物、新闻、事件都连成一张网。比如，它知道“微软”收购了“动视暴雪”，这两家公司是“父子”关系；如果“动视暴雪”因为某个新闻股价大涨，这个关系网能立刻感觉到“微软”可能也会跟着动。
关键点：这张地图是有时间戳的。它非常守规矩，只看“预测时刻之前”发生的事，绝不偷看未来的答案（这叫“防止未来泄露”）。

2. 拿着“寻宝图”找线索 (规则引导的探索)

这是 TRACE 最聪明的地方。普通的 AI 在地图上乱跑，容易迷路或产生幻觉（瞎编理由）。TRACE 手里拿着一本**“历史寻宝图” (规则库)**。

比喻：想象你在玩一个寻宝游戏。普通的 AI 是随机乱跑，看到什么捡什么。而 TRACE 是拿着侦探小说里的“经典作案手法”去抓人。
- 比如，规则库告诉它：“如果 A 公司投资了 B 公司，且 B 公司所在的行业（如 AI）最近有重大利好，那么 A 公司大概率会涨。”
过程：TRACE 不会漫无目的地搜索，它只沿着这些**“经济上说得通”**的路径去寻找证据。它像是一个经验丰富的老侦探，只关注那些历史上反复出现过的、有逻辑的因果链条。

3. 让“大语言模型”当法官 (LLM 验证与解释)

找到了线索后，TRACE 不会直接下结论，它会请一位**“大语言模型法官”**来审核。

审核什么：法官会检查这条线索是不是真的来自新闻原文？逻辑通不通？
- 例子：如果路径显示“微软收购了暴雪 -> 暴雪股价涨 -> 所以微软涨”，法官会去读当时的新闻，确认新闻里确实提到了收购和积极情绪。
产出结果：最后，它不仅能告诉你“明天涨”或“明天跌”，还能给你看完整的证据链：

“预测：涨。
理由：因为微软收购了暴雪（事件），新闻说这很积极（文本证据），根据历史规律，收购方通常会受益（规则）。”

为什么它很厉害？(成果)

在著名的标普 500 股票测试中，TRACE 的表现超过了其他很多先进的模型：

更准：它的预测准确率达到了 55.1%（在股市预测中，这已经是很高的水平了，因为市场非常难预测）。
更懂行：它特别擅长抓住那些“上涨”的机会（召回率高），这意味着它很少错过好的行情。
可解释：这是最大的亮点。以前的 AI 像个黑盒子，只给结果不给理由。TRACE 像个透明的玻璃盒子，每一步推理都有据可查，人类专家可以像审计一样检查它的逻辑。

总结

TRACE 就像一个结合了“老侦探经验”（规则）、“超级记忆力”（知识图谱）和“现代法律思维”（LLM 验证）的金融分析师。

它不靠运气，而是靠严密的逻辑链条和真实的新闻证据来预测股市。它不仅能告诉你明天股票会怎么走，还能像写侦探报告一样，把“为什么这么走”讲得清清楚楚，让投资者敢信、敢用。

Each language version is independently generated for its own context, not a direct translation.

1. 研究问题 (Problem)

股票价格预测是计算金融和数据挖掘中的核心难题。现有的方法主要存在两个关键局限性：

信息孤岛与关系缺失：传统的时间序列模型或基于文本的情感分析模型通常将不同股票视为独立实体，忽略了公司、事件和产品之间复杂的关系依赖网络（如并购、供应链、监管影响等）。
可解释性与幻觉问题：基于大语言模型（LLM）的方法虽然在自然语言理解上表现强大，但容易产生幻觉（编造不支持的事实），且缺乏可解释性，这在高风险的金融决策中是不可接受的。

核心目标：构建一个既能利用知识图谱（KG）捕捉复杂的市场关系，又能结合 LLM 进行推理，同时保证可解释性和事实 grounding（基于证据）的股票涨跌预测框架。

2. 方法论 (Methodology)

作者提出了 TRACE（Temporal Rule-Anchored Chain-of-Evidence，时间规则锚定的证据链）框架。该框架在一个端到端的管道中统一了符号关系先验、动态图探索和 LLM 引导的决策。

2.1 核心组件

规则引导的关系先验 (Rule-guided Relational Priors)：
- 从历史知识图谱快照中自动挖掘关系动机（Relational Motifs）。这些规则定义了允许的推理路径（例如：投资 -> 行业 -> 上涨）。
- 这些规则不作为静态约束，而是作为搜索空间的引导，确保推理路径反映具有经济意义的依赖关系，而非任意的图遍历。
基于文本锚定的图推理 (Graph-based Reasoning with Textual Grounding)：
- 动态知识图谱构建：整合异构数据（新闻、财报、事件、公司、人物等），构建包含时间戳的金融知识图谱。所有边和事实必须满足**“当时有效”（As-of）**约束，防止未来数据泄露。
- 规则锚定的路径探索：采用束搜索（Beam Search）遍历图谱。在扩展路径时，强制要求路径前缀必须匹配预挖掘的规则库。
- LLM 辅助剪枝与验证：
  - 关系选择器：LLM 根据上下文（节点类型、时间、邻居统计）评估候选关系的相关性，过滤无关路径。
  - 证据验证：对于生成的推理链，LLM 验证其是否与源文本（新闻/文件）内容一致，确保事实准确性。
可审计的判决聚合 (Auditable Verdict Aggregation)：
- 将高置信度的规则假设（Hypotheses）聚合为最终的 UP/DOWN 判决。
- 每个预测都附带显式的推理路径（从股票到事件再到新闻文本），形成人类可读的“证据链”。

2.2 算法流程

初始化：针对特定交易日 $t$ 和股票 $s$ ，在满足时间约束的图谱中初始化搜索。
搜索与扩展：使用束搜索探索多跳路径。每一步扩展必须满足：(1) 是某条挖掘规则的前缀；(2) 时间有效；(3) 通过 LLM 相关性筛选。
假设生成：当路径完整匹配一条高置信度规则（Confidence > 0.6）并连接到文本源时，生成一个预测假设。
判决：比较所有支持“上涨”和“下跌”假设的最大置信度，输出最终预测及 Top-M 条支持路径。

3. 关键贡献 (Key Contributions)

首个统一框架：提出了 TRACE，这是首个将符号路径挖掘、LLM 引导的图探索和LLM 验证的决策整合到金融时间知识图谱中的股票预测框架。
规则引导与文本锚定的推理机制：设计了独特的推理过程，利用挖掘出的关系模式约束可行路径，并将候选推理链锚定在新闻文章中，确保了经济相关性和时间有效性，同时消除了幻觉。
大规模实证与可解释性：构建了包含 4.2 万个节点、17.4 万条边的大规模金融知识图谱（基于 2022-2023 年标普 500 数据）。实验证明该方法在提升预测精度的同时，提供了由显式推理路径支持的透明预测。

4. 实验结果 (Results)

4.1 预测性能

在标普 500 股票次日涨跌预测任务中，TRACE 表现优于所有强基线（包括 XGBoost、T-GNN、纯新闻情感模型及 Agent 框架）：

准确率 (Accuracy): 55.1% (优于 XGBoost 的 52.9%)
精确率 (Precision): 55.7%
召回率 (Recall): 71.5% (显著高于其他模型，表明对上涨/下跌信号的捕捉能力更强)
F1 分数: 60.8%

4.2 回测表现 (Backtesting)

在 2023 年 1 月至 2024 年 1 月的 Top-10 买入并持有（Buy & Hold）策略回测中：

总回报率: 41.7% (远超等权重基准的 16.7% 和 XGBoost 的 27.0%)
夏普比率 (Sharpe Ratio): 2.00
最大回撤 (Max DD): -11.7% (优于大多数基线)

4.3 可解释性与消融实验

路径质量：85% 的预测由至少一条完整的“股票->文本源”路径支持；72% 的路径匹配了挖掘出的规则模式。
人工评估：金融分析师认为 73% 的推理路径具有“经济意义”，64% 具有“可执行性”。
消融分析：移除“多跳推理”导致性能下降最大（-2.1%），其次是“时间约束”（-1.4%）和“规则挖掘”（-1.1%），证明了各组件的必要性。
反事实分析：通过掩码（Mask）文本节点或关键边，模型性能随掩码比例单调下降，证明预测确实依赖于揭示的证据路径，而非虚假相关性。

5. 意义与价值 (Significance)

打破性能与透明度的权衡：TRACE 成功解决了金融预测中“高精度”与“可解释性”难以兼得的长期矛盾。它不仅能预测涨跌，还能提供人类可审计的推理链条（例如：“因为微软收购了动视暴雪，且新闻显示该事件对双方股价有正面影响，所以预测微软股价上涨”）。
减少幻觉与噪声：通过规则引导的搜索空间和 LLM 的事实验证，有效避免了 LLM 常见的幻觉问题，并过滤了无意义的图遍历噪声。
经济价值显著：回测结果显示，该模型不仅能提高分类准确率，还能转化为显著的经济收益（高夏普比率和低回撤），具有实际的投资应用潜力。
方法论创新：为将符号 AI（规则、逻辑）与神经 AI（LLM、嵌入）结合解决复杂时序推理问题提供了新的范式，特别是在需要严格事实依据的领域。

总结：TRACE 通过构建一个时间感知的、规则锚定的知识图谱推理系统，实现了可解释、高准确且具备经济价值的股票预测，为量化金融和 AI 决策的可信性树立了新的标杆。