文章预览
前言 数据,是数字时代的石油。 根据 IDC 预测: 到2025年,全球数据总量中将有超过80%的数据是非结构化数据。 向量数据是非结构化数据的抽象数学表达,向量数据库顾名思义就是专门处理向量数据的数据库。 众所周知, AI 三要素包括:算力、算法和数据。 向量数据库作为一种专门用于存储和检索向量数据的数据库系统,是将非结构化数据转化为机器可以理解的语义的关键所在。 随着 AI 尤其是大模型技术的快速发展,向量数据库的价值也愈发凸显了出来。 红杉美国发布的著名博客《生成式 AI 第二幕》和 A16Z 发布的《LLM 应用的新兴架构》两篇文章中一致提到: 向量数据库是重要的生成式人工智能基础设施。 A16Z 甚至认为: 从系统的角度来看,预处理管道中最重要的部分就是向量数据 库。 根据市场研究机构 MarketsandMarkerts 预测:202
………………………………