文章预览
Aximof| 编辑 科技博文| 分类 介绍 向量数据库Faiss是Facebook AI研究院开发的一种高效的 相似性搜索 和 聚类 的库。它能够快速处理大规模数据,并且支持在 高维空间 中进行相似性搜索。 Faiss的工作,就是把我们自己的候选向量集封装成一个index数据库,它可以加速我们检索相似向量Top K的过程,一些最有用的算法是在 GPU 上实现的。它主要由 Meta 的基础 AI 研究团队 FAIR 开发。 什么是相似性搜索? 给定一组d维度向量x_i,Faiss从中构建RAM中的数据结构。构造结构后,当给定一个新的d维度向量x时,它会有效地执行以下操作: 其中 是欧几里得距离(L2),寻找与x最相似的向量数据;其中计算 argmin 的过程就是在索引中搜索操作。 以下是Faiss能够完成的: 不仅返回最近邻的向量,还返回第二个最近的、第三个、...、第 k 个最近的邻居; 一次搜索多个向量
………………………………