讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

向量数据库-Faiss详解

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-05-28 00:51
    

文章预览

Aximof| 编辑 科技博文| 分类 介绍 向量数据库Faiss是Facebook AI研究院开发的一种高效的 相似性搜索 和 聚类 的库。它能够快速处理大规模数据,并且支持在 高维空间 中进行相似性搜索。 Faiss的工作,就是把我们自己的候选向量集封装成一个index数据库,它可以加速我们检索相似向量Top K的过程,一些最有用的算法是在 GPU 上实现的。它主要由 Meta 的基础 AI 研究团队 FAIR 开发。 什么是相似性搜索? 给定一组d维度向量x_i,Faiss从中构建RAM中的数据结构。构造结构后,当给定一个新的d维度向量x时,它会有效地执行以下操作: 其中 是欧几里得距离(L2),寻找与x最相似的向量数据;其中计算 argmin 的过程就是在索引中搜索操作。 以下是Faiss能够完成的: 不仅返回最近邻的向量,还返回第二个最近的、第三个、...、第 k 个最近的邻居; 一次搜索多个向量 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览