专栏名称: AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
目录
相关文章推荐
财宝宝  ·  中年大叔的悲哀。 ... ·  20 小时前  
广州楼王  ·  老黄埔,变了! ·  2 天前  
今天看啥  ›  专栏  ›  AI工程化

一个 Python 文件实现 Perplexity 搜索?

AI工程化  · 公众号  ·  · 2024-10-20 14:18

文章预览

想了解像 Perplexity 这样的 AI 搜索引擎是如何工作的吗? 这个名为"ask.py"的 开源项目 [1] 满足你的好奇心,它仅有一个文件,但实现效果堪比"迷你版 Perplexity",它巧妙地将搜索-提取-总结的核心流程浓缩在一个文件中。项目的工作流程颇具创意: 使用 Google API 搜索相关网页 爬取并提取文本内容 将内容分块存入向量数据库 执行向量搜索,找出最相关片段 利用 OpenAI API 基于上下文生成回答 虽然结构简单,但它涵盖了现代 AI 搜索引擎的核心过程。项目使用了 Google Search API 、OpenAI API 、Jinja2 、bs4 和 vectordb2 等库,展示了如何将这些工具整合成一个功能完整的搜索系统。 对于开发者来讲,它很适合学习。简单克隆代码,安装依赖,然后就能体验。项目还提供了丰富的自定义选项,如限制搜索时间范围和指定搜索网站。 无论你是想了解 AI 搜索引擎的工作原理学习借鉴, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览