华泰 | 传媒：豆包大模型能力对齐GPT-4o

华泰睿思 · 公众号 · 证券 · 2024-12-20 07:23

主要观点总结

本文介绍了火山引擎举办的FORCE原动力大会上，豆包大模型家族的全新升级，包括新发布的视觉理解模型和3D生成模型等。其中，视觉理解模型成为最大亮点，具有卓越的视觉理解与跨模态能力。此外，豆包通用模型pro在升级后综合能力全面对标GPT-4o，并且价格只有后者的1/8。同时，还介绍了企业端产品如火山方舟、扣子和HiAgent的帮助构建AI能力中心的情况。最后提到了字节AI产业链的投资价值及风险提示。

关键观点总结

关键观点1: 豆包大模型家族全新升级，包括新发布的视觉理解模型和3D生成模型等。

视觉理解模型成为最大亮点，具有内容识别、理解推理和视觉描述等能力。

关键观点2: 豆包视觉理解模型展现出卓越的视觉理解与跨模态能力。

包括更强内容识别、理解推理能力和更细腻的视觉描述。定价低于行业平均，有助于拓展应用场景和增加用户粘性。

关键观点3: 豆包通用模型pro升级后综合能力全面对标GPT-4o。

使用价格只有GPT-4o的1 ²。凭借其更强的模型效果和更低的推理成本，将进一步推动企业AI升级和增强C端用户体验和使用量。

关键观点4: 企业端产品如火山方舟、扣子和HiAgent帮助构建AI能力中心。

火山方舟提供全栈MaaS能力，扣子为智能体开发社区，HiAgent支持企业私有部署和混合部署模式。

关键观点5: 字节AI产业链的投资价值。

从C端AI应用和B端AI合作两方面介绍了字节AI产业链的投资价值。同时提醒投资者注意AI发展、用户反响和政策监管等风险提示。

文章预览

点击小程序查看研报原文核心观点豆包大模型家族全新升级，新发视觉理解模型成为最大亮点 12月18日火山引擎举办FORCE原动力大会，升级了豆包家族系列大模型，包括：新发布视觉理解模型和3D生成模型，升级豆包通用模型pro（对标GPT-4o）、视频生成模型（动态海报）、音乐模型（生成3分钟作品，复杂音乐创作）、文生图模型（一键P图/海报）。其中，视觉理解模型成为最大亮点，可同时输入文本和图像的相关问题，模型能综合理解并给出准确回答。豆包大模型的日均tokens调用量最新已超4万亿，较5月发布时增长超33倍。我们认为，豆包模型及相应AI应用正快速渗透，AI赋能B/C端时代有望加速到来。豆包视觉理解模型跨模态能力突出，低价推广有望解锁更多价值场景豆包视觉理解模型展现出卓越的视觉理解与跨模态能力：1）更强内容识别。能识别 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博