专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

如何做生成更好的视频图像?Meta&MIT最新《 流匹配(Flow Matching, FM) 》指南和代码

专知  · 公众号  ·  · 2024-12-13 11:00
    

文章预览

Yaron Lipman¹, Marton Havasi¹, Peter Holderrieth², Neta Shaul³, Matt Le¹, Brian Karrer¹, Ricky T. Q. Chen¹, David Lopez-Paz¹, Heli Ben-Hamu³, Itai Gat¹ ¹Meta FAIR, ²麻省理工学院计算机科学与人工智能实验室(MIT CSAIL), ³魏兹曼科学研究所 流匹配(Flow Matching, FM)是一种新兴的生成建模框架,在图像、视频、音频、语音以及生物结构等多个领域中实现了最先进的性能 。本指南提供了一份全面且自成体系的FM综述,涵盖其数学基础、设计选择及其扩展内容。同时,我们还提供了一个基于PyTorch的代码包,其中包含相关示例(例如图像和文本生成),旨在为有兴趣理解、应用和进一步开发FM的初学者和资深研究人员提供资源。 发布日期 :2024年12月10日 代码库 : https://github.com/facebookresearch/flow_matching 流匹配(Flow Matching, FM)简介 参考文献 Lipman等人, 2022; Albergo和Vanden-Eijnden, 2022; Liu等 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览