专栏名称: 知危
提供敏锐、独到的商业信息与参考,重点关注TMT、出海、新消费、新能源。
今天看啥  ›  专栏  ›  知危

如果o3图片推理很吸引你,那你一定要看看豆包大模型的新品

知危  · 公众号  · 科技创业 科技自媒体  · 2025-04-18 21:53
    

主要观点总结

火山引擎发布了豆包1.5·深度思考模型,包括大语言模型和多模态版本。该模型在数学、编程、科学等领域表现出色,并具备强大的视觉理解能力。豆包1.5·深度思考模型通过结合视觉和推理能力,能够处理复杂任务,如生物学、化学和地理学方面的视觉推理。此外,豆包App还推出了AI Agent工具和解决方案,支持客户基于工具套件自定制,并具备云原生推理套件来提供高性能、低成本的推理服务。火山引擎通过构建全面的技术体系,为企业提供从AI能力构建到业务场景落地的全栈解决方案。

关键观点总结

关键观点1: 豆包1.5·深度思考模型的发布

包括大语言模型和多模态版本,在数学、编程、科学等领域表现出色。

关键观点2: 豆包1.5·深度思考模型的视觉理解能力

具备强大的视觉理解能力,能够处理复杂任务,如生物学、化学和地理学方面的视觉推理。

关键观点3: 豆包App的AI Agent工具和解决方案

支持客户基于工具套件自定制,具备云原生推理套件来提供高性能、低成本的推理服务。

关键观点4: 火山引擎的技术体系和全栈解决方案

通过构建模型矩阵、智能体生态和云原生底座,为企业提供端到端的AI工业化能力。

关键观点5: 豆包1.5·深度思考模型的融合方法

优化了用户使用产品时的无感体验,触及了AI产品的本质。


文章预览

4 月 17 日 ,在 FORCE LINK AI 创新巡展·杭州站,火山引擎正式发布了豆包1.5·深度思考模型。 豆包1.5·深度思考模型一共有两个版本,分别是大语言模型 Doubao-1.5-thinking-pro 和多模态版本 Doubao-1.5-thinking-pro|m, 值得注意的是, 它的多模态是一种原生的多模态能力,将视觉理解和语言推理融入到了一个模型中。 在专业领域的推理任务比如数学、代码、科学等,Doubao-1.5-thinking-pro 都表现出色,基准测试达到或接近全球第一梯队水平;在非推理任务比如创意写作、人文知识阐述等,模型泛化能力也很强,适用的场景更加广泛和复杂。 以下是具体的跑分成绩: 在数学竞赛基准 AIME 2024 上获得了 86.7 分,与 o3-mini-high 的表现相当,并且显著优于 o1 和 DeepSeek R1; 在竞赛编程基准 Codeforces 上获得了 55.0 分,优于 DeepSeek R1; 在科学问答基准 GPQA 上获得了 77.3 分,接 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览