主要观点总结
字节跳动在火山引擎Force冬季大会上公布了多项AI模型和应用层的更新,包括类o1的视觉理解模型、3D生成模型等。字节的视觉理解模型与Kimi旗下的K1模型竞争,且已接入豆包App和PC端。即梦AI产品实现了图片和视频的生成,并首次实现了相对准确的中文文字生成。此外,字节还推出了3D生成模型,并提升了豆包音乐模型的生成时长。豆包App不仅抢夺了浏览器市场,还要抢占文档编辑器市场。在价格方面,豆包最强模型的价格仅为GPT-4o的1/8。字节在多模态大模型方面延续价格战策略,并调整组织架构以追赶AI发展的步伐。
关键观点总结
关键观点1: 字节推出类o1的视觉理解模型与Kimi竞争
字节跳动首次推出了类o1的视觉理解模型,与Kimi旗下的K1模型展开竞争。该模型已接入豆包App和PC端,可应用于图片问答、医疗健康、教育科研、电商购物、生活助手等场景。
关键观点2: 即梦AI实现中文文字生成
即梦AI产品首次实现了相对准确的中文文字生成,这是中文领域首个能以较高准确率在图像中生成文字的大模型。
关键观点3: 字节推出3D生成模型
字节还推出了3D生成模型,与火山引擎数字孪生平台eOmniverse结合使用,成为一套支持AIGC创作的“物理世界仿真模拟器”。该模型能够将2D图片转换为3D视频,为人类或AI智能体提供安全且无限丰富的训练环境。
关键观点4: 豆包App推出文档编辑器功能
除了模型能力的更新,豆包App还宣布了重要更新,将上线文档编辑器功能。用户可以在豆包客户端获得一个文档编辑界面,生成文档后,可以在画布中自由编辑,还可以让AI针对特定词语和段落进行改写或一键全文润色。
关键观点5: 价格战继续:豆包最强模型价格仅为GPT-4o的1/8
在基础模型方面,豆包最强模型的价格仅为GPT-4o的1/8。此外,字节还在视觉理解模型方面延续了价格战策略,面向企业级市场的输入价格比行业价格便宜85%。
文章预览
记者: 陆彦君 编辑:吴洋洋 Key Points 首次推出类o1的视觉理解模型,与Kimi旗下的K1模型对阵; 现在,即梦能控制图片中的文字生成; 李飞飞和Google之后,字节也有3D生成模型了; 豆包抢夺浏览器市场后,还要再抢占文档编辑器市场; 价格战继续:豆包最强模型价格只有GPT-4o的1/8。 作为大厂中最后两个推出大模型的公司之一,字节以短跑速度狂奔了一年。现在,它实现了在模型覆盖、产品矩阵和用户数量上的全面反超。 12月18日至19日,字节跳动在火山引擎Force冬季大会上公布了AI模型和应用层的多项更新。其中包括一款类o1模型的视觉理解模型和一个3D视频生成模型,前者使字节成为国内最早推出类o1模型的大公司,此前,国内仅有初创公司 月之暗面(后简称Kimi)推出过类似模型 ;后者则使字节加入「世界模拟器」的参赛阵营。 对于大公司和初
………………………………