如果o3图片推理很吸引你，那你一定要看看豆包大模型的新品

知危 · 公众号 · 科技创业科技自媒体 · 2025-04-18 21:53

主要观点总结

火山引擎发布了豆包1.5·深度思考模型，包括大语言模型和多模态版本。该模型在数学、编程、科学等领域表现出色，并具备强大的视觉理解能力。豆包1.5·深度思考模型通过结合视觉和推理能力，能够处理复杂任务，如生物学、化学和地理学方面的视觉推理。此外，豆包App还推出了AI Agent工具和解决方案，支持客户基于工具套件自定制，并具备云原生推理套件来提供高性能、低成本的推理服务。火山引擎通过构建全面的技术体系，为企业提供从AI能力构建到业务场景落地的全栈解决方案。

关键观点总结

关键观点1: 豆包1.5·深度思考模型的发布

包括大语言模型和多模态版本，在数学、编程、科学等领域表现出色。

关键观点2: 豆包1.5·深度思考模型的视觉理解能力

具备强大的视觉理解能力，能够处理复杂任务，如生物学、化学和地理学方面的视觉推理。

关键观点3: 豆包App的AI Agent工具和解决方案

支持客户基于工具套件自定制，具备云原生推理套件来提供高性能、低成本的推理服务。

关键观点4: 火山引擎的技术体系和全栈解决方案

通过构建模型矩阵、智能体生态和云原生底座，为企业提供端到端的AI工业化能力。

关键观点5: 豆包1.5·深度思考模型的融合方法

优化了用户使用产品时的无感体验，触及了AI产品的本质。

文章预览

4 月 17 日，在 FORCE LINK AI 创新巡展·杭州站，火山引擎正式发布了豆包1.5·深度思考模型。豆包1.5·深度思考模型一共有两个版本，分别是大语言模型 Doubao-1.5-thinking-pro 和多模态版本 Doubao-1.5-thinking-pro|m，值得注意的是，它的多模态是一种原生的多模态能力，将视觉理解和语言推理融入到了一个模型中。在专业领域的推理任务比如数学、代码、科学等，Doubao-1.5-thinking-pro 都表现出色，基准测试达到或接近全球第一梯队水平；在非推理任务比如创意写作、人文知识阐述等，模型泛化能力也很强，适用的场景更加广泛和复杂。以下是具体的跑分成绩：在数学竞赛基准 AIME 2024 上获得了 86.7 分，与 o3-mini-high 的表现相当，并且显著优于 o1 和 DeepSeek R1；在竞赛编程基准 Codeforces 上获得了 55.0 分，优于 DeepSeek R1；在科学问答基准 GPQA 上获得了 77.3 分，接 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博