专栏名称: AIGC开放社区
专注AIGC(生成式人工智能)领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展应用和落地,以及国内LLM的发展和市场研究,社区秉承共建、共享、开放的理念,提供对社区会员有价值的商业化思路和服务。
今天看啥  ›  专栏  ›  AIGC开放社区

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

AIGC开放社区  · 公众号  ·  · 2024-03-11 07:24
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!阿里巴巴集团的技术团队推出了文本+图片生成高保真视频模型——AtomoVideo。用户通过AtomoVideo只需要提供高清图片和简单的文本提示,就能快速生成高清视频并保留逼真的细节。根据评测数据显示,AtomoVideo生成的视频在动作连贯性、图片一致性、时序一致性、运动强度等方面超过了VideoCrafter、I2VGEN-XL、SVD开源模型,可媲美商业模型Gen-2和Pika。论文地址:https://arxiv.org/abs/2403.01800项目地址:https://atomo-video.github.io/AtomoVideo生成视频展示AtomoVideo架构简单介绍AtomoVideo使用了预训练的Stable Diffusion 1.5作为基础模型,并在每个空间卷积和注意力层之后新增了1D时序卷积和时序注意力模块。AtomoVideo的技术创 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照