原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
想象一下,你正在尝试预测在一个庞大且不断变化的社交网络中,谁会与谁成为朋友。要做到这一点,你需要了解网络中每个人的两件事:
- 他们此刻是谁:他们的当前档案、兴趣,以及他们在这一确切时刻正在与谁交谈(空间信息)。
- 他们曾经是谁:他们在过去几个月里的整个友谊、争吵和互动历史(时间信息)。
长期以来,计算机科学家构建了“动态图神经网络”(DGNNs)来解决这个问题。然而,该论文指出,几乎所有现有方法都犯了一个关键错误:它们按顺序查看这两部分信息,就像一页一页地读书一样。
旧方法:装配线瓶颈
该论文描述了这些旧模型工作的两种常见方式,两者都存在“信息瓶颈”:
- “时间优先”工厂:想象一个工厂,一名工人首先阅读一个人的完整人生故事(历史)并写下一份简短的摘要笔记。只有在写下该笔记之后,第二名工人才会查看这个人此刻正在与谁交谈。
- 问题:第二名工人无法问:“嘿,这个人正在和他以前的老朋友交谈,但他的当前档案显示他讨厌对方。”在看到当前语境之前,历史已经被锁在摘要笔记里了。
- “空间优先”工厂:想象相反的情况。一名工人首先查看这个人此刻正在与谁交谈并将他们分组。只有在完成该分组之后,第二名工人才会查看这个人的历史。
- 问题:第二名工人无法说:“等等,这群人看起来很可疑,因为从历史上看,这个人从未与他们混在一起。”在查阅历史之前,当前的分组已经完成了。
在这两种情况下,模型都被迫基于过去或现在的“压缩”版本做出决定,错失了实时权衡它们的机会。
新方法:SiST-GNN(同时时空)
作者提出了一种名为SiST-GNN的新架构。与其说是装配线,不如想象一场圆桌讨论,每个人都可以同时发言。
以下是 SiST-GNN 的工作原理,使用一个简单的类比:
- 孪生概念:对于网络中的每个人,模型创建一个“孪生体”。
- 孪生体 A 持有该人的当前档案和当前朋友。
- 孪生体 B 持有该人的完整历史(其过去的运行摘要)。
- 增强图:模型构建了一个特殊的、更大的地图。在这张地图上,孪生体 A 和孪生体 B 相互连接。此外,孪生体 A 连接到孪生体 B 的邻居,孪生体 B 连接到孪生体 A 的邻居。
- 同时聊天:现在,模型运行单个“消息传递”步骤。在这一步中,每个人(及其孪生体)同时与他们的邻居交谈。
- 因为大家都在一起交谈,模型可以决定:“对于这个特定的预测,我应该更多地倾听孪生体 B(历史),因为当前的对话令人困惑”,或者“我应该更多地倾听孪生体 A(当前状态),因为历史已经过时了”。
模型不必先选择保留哪种信息;它可以同时权衡两者,就像法官在做出判决之前同时听取当前证词和过往记录一样。
结果:巨大的飞跃
作者在 9 个不同的真实世界数据集(包括比特币信任网络、大学留言板和 Reddit)上,将这种新的“圆桌”方法与 14 种不同的现有模型进行了测试。
链接预测(预测未来连接):
- 在“固定”测试(一次性查看整体情况)中,SiST-GNN 比之前的最佳方法提高了 109% 到 277%。
- 在“实时”测试(随着新数据到来而更新,就像实时馈送一样)中,它提高了 68% 到 194%。
- 类比:如果旧模型是以 50% 的准确率猜测天气,那么 SiST-GNN 就是以近乎完美的准确率进行猜测。
节点分类(发现异常):
- 该模型还接受了在连续数据流中识别“不良行为者”(如被禁止的用户)的测试。即使 SiST-GNN 必须将数据分组为时间块(就像将电子邮件放入每日文件夹中),它仍然比最好的“离散时间”模型高出 7% 到 22%。
- 值得注意的是,它的表现与最先进的“连续时间”模型一样好,后者根本不需要将数据分组为块。
为什么这很重要(根据论文)
论文声称,这种巨大改进的原因不仅仅是模型更“聪明”或拥有更多的计算能力。而是因为架构终于允许模型将一个人的历史和他们的当前情况视为可以直接相互交谈的邻居。
通过消除“装配线”瓶颈,模型终于可以这样说:“我看到你现在正在和一个陌生人交谈,但你的历史显示你总是信任像这样的陌生人,所以我会信任这次互动。”或者相反:“你正在和一个朋友交谈,但你的历史显示你们刚刚闹翻了,所以我会持怀疑态度。”
该论文得出结论,这种“同时”方法是一个根本性的升级,适用于不同类型的网络和任务,为如何教导计算机理解不断变化的关系设定了新标准。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。