天池,基于阿里云的开放数据处理服务ODPS,面向学术界开放海量数据和分布式计算资源,旨在打造“数据众智、众创”第一平台。在这里,人人都可以玩转大数据,共同探索数据众创新模式。
今天看啥  ›  专栏  ›  天池大数据科研平台

「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!

天池大数据科研平台  · 公众号  · 大数据  · 2025-04-23 10:22
    

主要观点总结

本文介绍了视频生成领域的新进展,包括Sand AI推出的全球首个自回归视频生成大模型MAGI-1。MAGI-1具有流畅度高、精准时间轴控制、自然运动等特点,可以通过提示词生成不同场景的视频。文章还介绍了MAGI-1的技术细节、评估结果以及Sand AI团队背景和融资情况。

关键观点总结

关键观点1: Sand AI推出全球首个自回归视频生成大模型MAGI-1

MAGI-1可以通过自回归预测视频块序列来生成视频,具有流畅、自然的特点,并且支持精准时间轴控制。

关键观点2: MAGI-1的特点

MAGI-1生成的视频流畅度高,不卡顿,可以无限续写;具有精准时间轴控制,用户可以按自己设想的那样,精准地雕琢每一秒;运动更加自然,更有生机。

关键观点3: MAGI-1的技术细节

MAGI-1基于Transformer的VAE变分自编码器架构,融合了多项关键创新技术,包括自回归去噪算法、扩散模型架构和蒸馏算法等。

关键观点4: MAGI-1的评估结果

MAGI-1在内部人工评估和物理评估中都表现出色,实现了最先进的性能,尤其在指令遵循和运动质量方面。

关键观点5: Sand AI团队背景和融资情况

Sand AI由清华大学软件工程博士曹越和微软亚洲研究院的张拯等人联合创立。目前共融资近六千万美金。连续三轮融资分别由源码、今日、经纬领投。


文章预览

本文转载来源:机器之心公众号,不代表官方立场 视频生成领域,又出现一位重量级开源选手。 昨天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。 以下是一些官方 demo: 提示词(翻译版):柔和的自然光:一个留着卷曲的红棕色长发的年轻人站在盛开的白花中。花朵在主体周围突出而丰富,创造了一个花卉背景。这个人似乎在花园或自然环境中,郁郁葱葱的绿叶在背景中模糊。孩子轻轻地弯下腰闻闻花香,然后慢慢睁开眼睛。她的脸上绽开了笑容,因为她很享受这一刻。相机一直聚焦在孩子身上,确保她始终站在镜头的中心。超高画质,超高清,8K。 提示词(翻译版):特写镜头:老船长目不转睛 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览