专栏名称: OneFlow
不止于成为世界上最快的开源深度学习框架
今天看啥  ›  专栏  ›  OneFlow

OpenAI安全系统负责人:从头构建视频生成扩散模型

OneFlow  · 公众号  ·  · 2024-05-21 10:34
    

文章预览

作 者 | Lilian Weng OneFlow编译 翻译|杨婷、宛子琳、张雪聃 题图由SiliconFlow MaaS平台生成 过去 几年,扩散模型(Diffusion models)在图像合成领域取得了显著成效。 目前,研究界已开始尝试更具挑战性的任务——将该技术用于视频生成。 视频生成任务是图像生成的扩展,因为视频本质上是一系列连续的图像帧。 相较于单一的图像生成,视频生成的难度更大,原因如下: 它要求在时间轴上各帧之间保持时间一致性,这自然意味着需要将更多的世界知识嵌入到模型中。 相较于文本或图像,收集大量高质量、高维度的视频数据难度更大,更不用说要获取文本与视频的配对数据了。 阅读要求:在继续阅读本文之前,请确保你已经阅读了之前发布的关于图像生成的“什么是扩散模型?( https://lilianweng.github.io/posts/2021-07-11-diffusion-models/ )”一文。(本文作者Li ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览