Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

本文提出了一种名为投影增强图(PAG)的新型近似最近邻搜索框架,通过结合投影技术与图索引,在满足现代 AI 应用六大关键需求的同时,实现了比 HNSW 快达 5 倍的查询性能、快速的索引构建速度以及良好的高维扩展性和在线插入支持。

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 PAG(投影增强图)的新方法,用来解决现代人工智能中一个非常头疼的问题:如何在海量数据中快速找到“最相似”的东西

为了让你轻松理解,我们可以把这个问题想象成在一个超级巨大的图书馆里找书。

1. 现在的困境:找书太慢或太贵

想象一下,你有一个图书馆,里面有几亿本书(数据),每本书都有一个独特的“指纹”(向量)。当你问:“我想找一本关于‘夏日海滩’的书”时,系统需要找出最像的那几本。

  • 旧方法(如 HNSW): 就像派了一个超级勤奋的图书管理员,他手里有一张巨大的地图(索引图)。为了找到书,他必须亲自跑遍地图上的很多条路,甚至要把每本书的封面都拿起来仔细比对(计算精确距离)。
    • 缺点: 虽然找得挺准,但太累了(计算慢),而且建这个地图要跑断腿(建索引慢),地图本身也占用了整个图书馆的很多空间(内存大)。
  • 其他方法(如量化法): 就像把书的内容简化成几个关键词(压缩数据)。
    • 缺点: 虽然查得快、省空间,但容易“张冠李戴”,找不准书(召回率低),而且一旦书多了或者维度高了(书的内容太复杂),效果就大打折扣。

2. 论文的核心创意:PAG(带“望远镜”的图书管理员)

作者提出了一种新办法 PAG。你可以把它想象成给那位图书管理员配备了一副神奇的“投影望远镜”

这个望远镜有两个核心功能:

A. 快速筛选(投影测试)

在管理员决定要不要亲自跑过去拿书比对之前,他先戴上望远镜,远远地看一眼。

  • 原理: 望远镜通过一种数学技巧(随机投影),把复杂的书脊信息简化成几个简单的数字。
  • 作用: 如果望远镜显示“这本书肯定不是你要的”,管理员就直接跳过,根本不用跑过去,也不用拿起来仔细比对。
  • 比喻: 就像你在超市找可乐,你不需要把每瓶饮料都拧开尝一口。你只需要看一眼标签上的“可乐”字样(投影测试),如果不是,直接忽略。这省下了 90% 的力气。

B. 智能反馈与纠错(TFB 和 PES)

这是 PAG 最聪明的地方。

  • 反馈缓冲(TFB): 有时候望远镜会“看走眼”,把一本不是可乐的书(假阳性)误判为可能是可乐。旧方法会直接扔掉这个错误信息。但 PAG 会把这些“看走眼”的书先记在小本本上(测试反馈缓冲区)。等到下一轮搜索时,如果这些书还没被排除,就再仔细检查一次。这样既利用了之前的计算,又避免了重复劳动。
  • 概率选边(PES): 在建立地图(索引)的时候,PAG 不仅看眼前的路,还会用望远镜预测“哪条路可能通向宝藏”。如果望远镜说“这条路虽然看起来远,但很有希望”,管理员就会多建一条路连过去。这让地图在复杂地形(高维数据)下依然畅通无阻。

3. PAG 解决了什么痛点?(六大需求)

现代 AI 应用(比如你手机里的推荐系统、AI 聊天机器人)对找书有六个苛刻要求,PAG 都能搞定:

  1. 找得快(QPS): 就像管理员用望远镜,每秒能处理几千次查询,比旧方法快 5 倍
  2. 建图快(索引): 以前建地图要跑断腿,现在因为有望远镜辅助筛选,建图速度飞快,适合需要“即时上线”的应用。
  3. 占地小(内存): 不需要把每本书的详细信息都印在地图上,只存关键信息,省空间。
  4. 不怕书太厚(高维): 现在的书(数据)越来越厚(维度高,比如 3000 多行),旧方法会晕头转向,PAG 的望远镜依然清晰。
  5. 找多找少都稳(鲁棒性): 不管你是想找 10 本书(聊天机器人),还是想找 1000 本书(推荐系统),PAG 都能保持高效。
  6. 支持随时加书(在线插入): 图书馆每天进新书,PAG 不需要把地图拆了重画,可以像往活页夹里加页一样,随时把新书插进去,不影响别人找书。

4. 总结:为什么它很厉害?

这就好比以前的图书管理员是靠腿跑,现在的 PAG 管理员是靠“望远镜 + 经验 + 小本本”

  • 以前: 为了找书,必须把路跑通,把书拿起来看。
  • 现在: 先用望远镜快速排除 90% 的干扰项,只对剩下的 10% 进行精确比对。而且,它还能在“建图”和“找书”两个环节都利用这种技巧。

实验结果:
作者在 6 个现代数据集(包括最新的文本、图像数据)上做了测试。结果显示,PAG 在速度上吊打老牌冠军 HNSW(快 5 倍),在准确度上也不输,而且建图速度和内存占用都非常优秀。

一句话总结:
PAG 就像给 AI 找东西装上了一个智能导航仪,让它不再盲目地跑遍所有路,而是聪明地“看”一眼就决定走哪条路,从而实现了又快、又准、又省资源的搜索体验。