专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

RAG能帮你省32倍存储空间/速度提升40倍的量化技术#ai##-20241012074311

黄建同学  · 微博  · AI  · 2024-10-12 07:43

文章预览

2024-10-12 07:43 本条微博链接 RAG能帮你省32倍存储空间/速度提升40倍的量化技术 #ai# #程序员# 【2分钟学点RAG - RAG量化技术Quantizatoin】量化是将高精度数据压缩成低精度数据的过程,RAG中,量化将向量数据进行压缩,以优化存储空间和查询速度。比如在qdrant向量数据库中,有Scalar Quantization标量量化、Binary Quantization二进制量化等。其中二进制量化能够将存储空间压缩32倍,查询速度提升40倍,而且在相似度查询的时候,精度上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览