今天看啥  ›  专栏  ›  数字进化岛

阿里推出对标DeepSeek-R1的大模型产品,我试了试发现……

数字进化岛  · 公众号  · 互联网安全 科技自媒体  · 2025-02-25 11:51
    

主要观点总结

文章介绍了阿里Qwen团队发布的推理模型——深度思考 (QwQ),其与DeepSeek-R1的对比,以及DeepSeek的技术架构优化情况。文章还提到了其他云市场的情况,以及深度思考模型的功能和特点,包括支持联网搜索、生成图片和视频等。

关键观点总结

关键观点1: 阿里Qwen团队发布的新推理模型深度思考 (QwQ)

深度思考是基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI智能体等。它支持联网搜索,并且不卡顿。

关键观点2: DeepSeek-R1与深度思考 (QwQ)的对比

两者都擅长解决数学和推理问题,并展示思考过程。但深度思考在生成答案质量方面还有待提升,目前还是一个预制版本。

关键观点3: DeepSeek的技术架构优化

DeepSeek进行技术架构升级优化,以解决繁忙次数过多和联网问题。优化后,其体验有所提升,但偶尔仍会宕机。

关键观点4: 其他云市场的情况

其他云服务商如腾讯、百度、华为等在AI领域有不同的发展战略。腾讯和百度拥抱DeepSeek更为深刻,而华为不涉及C端AI入口应用。

关键观点5: 深度思考模型的功能和特点

深度思考支持生成图片,后续还会支持生成视频。这是一个多模态大模型,功能上更加健全。


文章预览

一早醒来就看到个大消息—— 阿里Qwen团队今日宣布在Qwen Chat发布了推理模型——深度思考 (QwQ) 。 在我理解中,这其实就是阿里对标 DeepSeek-R1的大模型产品。因为 这是一个基于Qwen2.5-Max的推理模型,更加擅长数学理解、编程、AI智能体等。DeepSeek-R1也是擅长解决数学和推理问题。 更为重要的是,这俩都把思考过程给显示出来了。 和DeepSeek-R1表现出来的产品心态,一模一样。 更重要的事,经过测试我发现,深度思考 (QwQ) 不仅支持深度思考,还支持联网搜索。并且,不卡顿。 其实,DeepSeek-R1现在最大的痛点有两个。第一总是繁忙,根本没办法实现多轮对话,除非你有耐心每次提问中间都能等一个小时。第二,联网基本不给你答案。 昨天我看到 凤凰网科技发了个报道,说DeepSeek繁忙次数变少了。原因可能是因为 DeepSeek又进行了技术架构升级优化。 有接 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览