专栏名称: Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
今天看啥  ›  专栏  ›  Founder Park

后发先至,字节版 Sora 发布!10秒长度、多主体交互、一致性多镜头

Founder Park  · 公众号  ·  · 2024-09-24 20:38
    

文章预览

9月 24 日,字节跳动的豆包大模型发布多款新品——视频生成、音乐生成以及同声传译大模型。 字节的视频生成模型首次亮相,这也意味着,在快手之后, 国内的两大短视频巨头都进入了AI视频生成赛道。 发布会上还公布了豆包大模型的最新数据,截至9月, 豆包大模型的日均 tokens 使用量已经超过1.3万亿 ,4个月的时间里 tokens 整体增长超过了10倍。在多模态方面,豆包·文生图模型日均生成图片5,000万张,此外,豆包目前日均处理语音85万小时。 目前,豆包大模型已涵盖大语言模型、视觉大模型、语音大模型三大品类发布了13个大模型。此外,豆包通用模型Pro升级,初始TPM支持800k、上下文窗口达到256k。 文章转载自「豆包」官方文章,部分内容转载自「智东西」 。 点击关注,每天更新深度 AI 行业洞察 01  视频生成: 多主体交互,一致性多镜头生 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览