今天看啥  ›  专栏  ›  机器之心

豆包说要「普惠」,于是大模型处理图片按「厘」计价了

机器之心  · 公众号  · AI  · 2024-12-23 11:51
    

主要观点总结

本文报道了OpenAI和国产大模型豆包之间的激烈竞争。豆包大模型家族的新成员豆包·视觉理解模型以惊人的价格和能力震撼业界。该模型一千个token的输入价格仅3厘钱,并能处理多种视觉任务。此外,豆包通用模型Pro、豆包·音乐生成模型和豆包·文生图模型也宣布升级。火山引擎作为字节跳动的技术支持平台,解决了成本落地问题,为豆包大模型的普及做出了贡献。同时,展望未来的大模型发展方向,文章对豆包大模型的未来充满期待。

关键观点总结

关键观点1: 豆包大模型家族的新成员——豆包·视觉理解模型震撼发布,具备强大的图像处理能力。

该模型价格极低,每处理一张720P的图片仅需花费极低的价格;具备强大的视觉理解能力,可以完成复杂的视觉问答任务;能够识别图像中的知识、文化背景、状态、数量等信息,并具备深度推理能力,包括数学、逻辑、代码等。

关键观点2: 豆包通用模型Pro、豆包·音乐生成模型和豆包·文生图模型宣布升级。

这三个模型在各自领域取得了显著的进步,提供了更强大的功能。豆包通用模型Pro在综合能力上有了显著的提升,特别是在指令遵循、代码、专业知识、数学层面。豆包·音乐生成模型能够生成更长的音乐作品,包括前奏、主歌、副歌等复杂结构。豆包·文生图模型则在通用性、可控性、高质量三方面取得了新突破,新增了「一键海报」和「一键P图」能力。

关键观点3: 火山引擎作为技术支持平台,解决了大模型的落地问题。

火山引擎提供了一系列工具和服务,包括一站式大模型服务平台火山方舟、大模型应用开发平台扣子、企业专属AI应用创新平台HiAgent等,帮助企业用户更好地应用大模型。此外,火山引擎还推出了Prompt优解、大模型记忆应用等产品,持续保障企业级AI应用的落地。


文章预览

机器之心报道 作者:蛋酱 这段时间,OpenAI 宣告连续 12 轮轰炸,让 2024 年底的大模型领域热闹起来了。 但坚持每个凌晨看直播的话会发现,越到后面的发布越平淡,内心的波动也越少了。 今年的大模型就卷到这里了吗?并没有,国产大模型又卷起来了,还给 OpenAI 来了一记「重拳」。 就在前几天,2024 冬季火山引擎 FORCE 原动力大会上,字节跳动的豆包大模型家族,来了一场爆发式上新。 最受关注的是豆包大模型家族的新成员 —— 豆包・视觉理解模型 。顾名思义,它让豆包有了「看懂」世界的能力。更重要的是, 这款新模型一千个 token 的输入价格仅 3 厘钱,也就是说花一块钱就能处理 284 张 720P 的图片,比行业价格便宜了 85%。 价格官宣的那一刻,或许众多企业用户在心里默念了一句:太好了,是豆包,我们有救了。 至于这款模型的理解能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览