今天看啥  ›  专栏  ›  OneFlow

OpenAI安全系统负责人:从头构建视频生成扩散模型

OneFlow  · 公众号  ·  · 2024-05-21 10:34
作者 | Lilian WengOneFlow编译翻译|杨婷、宛子琳、张雪聃题图由SiliconFlow MaaS平台生成过去几年,扩散模型(Diffusion models)在图像合成领域取得了显著成效。目前,研究界已开始尝试更具挑战性的任务——将该技术用于视频生成。视频生成任务是图像生成的扩展,因为视频本质上是一系列连续的图像帧。相较于单一的图像生成,视频生成的难度更大,原因如下:它要求在时间轴上各帧之间保持时间一致性,这自然意味着需要将更多的世界知识嵌入到模型中。相较于文本或图像,收集大量高质量、高维度的视频数据难度更大,更不用说要获取文本与视频的配对数据了。阅读要求:在继续阅读本文之前,请确保你已经阅读了之前发布的关于图像生成的“什么是扩散模型?(https://lilianweng.github.io/posts/2021-07-11-diffusion-models/)”一文。(本文作者Lilian Weng是Op ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照