专栏名称: APPSO
让智能手机更好用的秘密。
今天看啥  ›  专栏  ›  APPSO

OpenAI 和 Grok 都在卷的 「深度检索」,Perplexity 推出了免费版,实测怎么样

APPSO  · 公众号  · app  · 2025-02-24 17:56
    

主要观点总结

Perplexity推出新功能「Deep Research」深度研究,强调深度检索和专业输出,对标OpenAI的模式。本文将从其推出的背景、测试情况、与其他模型的对比、及特定方面的考察来探讨其性能特点。

关键观点总结

关键观点1: 新功能的推出背景及目的

Perplexity通过接入DeepSeek R1后,推出「Deep Research」以区别于以往的常规模式测试,主打深度检索和专业输出。

关键观点2: 在Humanity's Last Exam测试上的表现

「Deep Research」在Humanity's Last Exam测试上获得21.1%的准确率,远高于其他模型。该测试涵盖多个学科,被视为人工智能系统的综合基准。

关键观点3: 对Deep Research特定方面的考察

文章从权威性、资料实时性、音视频理解能力、逻辑完整性以及模糊问题处理等方面对Deep Research进行了考察。

关键观点4: Deep Research与竞争产品的对比

文章提到了与DeepSeek R1等模型的对比,指出Deep Research在某些方面的优点和不足。

关键观点5: 总结和展望

文章总结称,「深度研究」是一个竞争激烈的场景,并提到Perplexity正在招募合作伙伴。应聘者可通过指定邮箱投递简历。


文章预览

接入 DeepSeek R1 之后,Perplexity 总算在本职业务上有所更新了,推出了「Deep Research」深度研究。要知道在此之前,它比较大的动作是接入购物功能…… 「深度研究」是对标 OpenAI 的 Deep Research 的模式,主打深度检索、专业输出。在 Humanity's Last Exam 上获得了 21.1% 的准确率,远高于 Gemini Thinking、o3-mini、o1、DeepSeek-R1 和许多其他领先模型。这个测试包含 3,000 多个问题,涵盖 100 多个学科,从数学和科学到历史和文学,被视为人工智能系统的综合基准。 新功能已经全量推送,注意:免费用户每天只有五次试用。 指路👉🏻:https://www.perplexity.ai/ 既然说是「深度研究」,那么为了区别于以往的常规模式测试,我们在问题设计上有所调整, 直接上难度, 重点检验一下它是不是真的到了能出报告的地步。 基本面测试,升级了但没完全升 这意味着问题艰深、资 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览