主要观点总结
本文介绍了火山引擎举办的FORCE原动力大会上,豆包大模型家族的全新升级,包括新发布的视觉理解模型和3D生成模型等。其中,视觉理解模型成为最大亮点,具有卓越的视觉理解与跨模态能力。此外,豆包通用模型pro在升级后综合能力全面对标GPT-4o,并且价格只有后者的1/8。同时,还介绍了企业端产品如火山方舟、扣子和HiAgent的帮助构建AI能力中心的情况。最后提到了字节AI产业链的投资价值及风险提示。
关键观点总结
关键观点1: 豆包大模型家族全新升级,包括新发布的视觉理解模型和3D生成模型等。
视觉理解模型成为最大亮点,具有内容识别、理解推理和视觉描述等能力。
关键观点2: 豆包视觉理解模型展现出卓越的视觉理解与跨模态能力。
包括更强内容识别、理解推理能力和更细腻的视觉描述。定价低于行业平均,有助于拓展应用场景和增加用户粘性。
关键观点3: 豆包通用模型pro升级后综合能力全面对标GPT-4o。
使用价格只有GPT-4o的1 ²。凭借其更强的模型效果和更低的推理成本,将进一步推动企业AI升级和增强C端用户体验和使用量。
关键观点4: 企业端产品如火山方舟、扣子和HiAgent帮助构建AI能力中心。
火山方舟提供全栈MaaS能力,扣子为智能体开发社区,HiAgent支持企业私有部署和混合部署模式。
关键观点5: 字节AI产业链的投资价值。
从C端AI应用和B端AI合作两方面介绍了字节AI产业链的投资价值。同时提醒投资者注意AI发展、用户反响和政策监管等风险提示。
文章预览
点击小程序查看研报原文 核心观点 豆包大模型家族全新升级,新发视觉理解模型成为最大亮点 12月18日火山引擎举办FORCE原动力大会,升级了豆包家族系列大模型,包括:新发布视觉理解模型和3D生成模型,升级豆包通用模型pro(对标GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品,复杂音乐创作)、文生图模型(一键P图/海报)。其中,视觉理解模型成为最大亮点,可同时输入文本和图像的相关问题,模型能综合理解并给出准确回答。豆包大模型的日均tokens调用量最新已超4万亿,较5月发布时增长超33倍。我们认为,豆包模型及相应AI应用正快速渗透,AI赋能B/C端时代有望加速到来。 豆包视觉理解模型跨模态能力突出,低价推广有望解锁更多价值场景 豆包视觉理解模型展现出卓越的视觉理解与跨模态能力:1)更强内容识别。能识别
………………………………