在DeepSeek老家发新模型，豆包怎么想的？

凤凰网科技 · 公众号 · 科技媒体 · 2025-04-17 21:15

主要观点总结

本文介绍了字节跳动旗下AI助手豆包大模型的最新进展，包括其深度思考模型的上线、多模态能力以及API价格等方面的信息。文章指出，虽然DeepSeek在某些方面表现突出，但豆包大模型在用户量级、投入产出比等方面面临挑战。同时，豆包还在不断加强模型研发投入，并推出视觉版模型来解决DeepSeek只能处理文字输入的局限性。业内认为，大模型的竞争将逐渐集中在几家主要厂商之间。

关键观点总结

关键观点1: 豆包大模型的深度思考模型上线，具有多模态能力，可以处理图像和文字等多元信息。

豆包大模型的深度思考模型已经正式上线，并且推出了视觉版模型，具有原生多模态深度思考能力，可以处理图像和文字等多种信息。这一功能通过一键拍图识别地点、识别外文菜单等应用场景得到了展示。

关键观点2: 豆包大模型的研发进展和竞争优势。

火山引擎总裁谭待分享了豆包大模型的研发进展，包括其人类评估表现超出DeepSeek R1 8%，单位推理成本降低了50%，在数学推理、编程竞赛、科学推理等专业任务领域性能优异。此外，豆包大模型还具备“边想边搜”的能力，并解决了DeepSeek R1只能做文字输入的最大难点。

关键观点3: 豆包大模型的API价格和竞争态势。

豆包推理模型的API价格相较于同等级模型如阿里qwen-plus和DeepSeek R1具有一定竞争力。此外，豆包深度思考模型采用MoE架构，总参数为200B，每次推理时激活的参数为20B，可以更低延迟。业内认为，大模型的竞争将逐渐集中在几家主要厂商之间，包括DeepSeek、阿里和字节跳动。

文章预览

摘要：尽管研发模型是当前最紧要的任务，但凤凰网科技从豆包内部人士处了解到，内部对应用层的投入同样巨大，“拿的资源不比模型层少”。凤凰网科技出品作者｜徐珍编辑｜董雨晴豆包的思考模型终于正式揭开面纱。 4月17日，火山引擎总裁谭待现身杭州，分享近四个月以来字节豆包大模型的研发进展。其中最值得关注的，是思考模型Doubao-1.5-thinking-pro的正式上线。目前，其已通过火山引擎正式开放体验接口。一季度，AI赛道天翻地覆。 DeepSeek最先凭借推理模型震惊海外，大厂的步伐相对滞后，这让去年AI战略被打满分的字节跳动略显尴尬。不过，有行业人士对凤凰网科技表示，“豆包的步伐会慢，跟它用户量级大有关，如何平衡投入产出比是个问题”。据谭待表述，豆包大模型在3月底日均tokens使用量已超12.7万亿，是2024年12月的3倍 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博