专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

极市平台  · 公众号  ·  · 2024-08-24 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨新智元 来源丨新智元 编辑丨极市平台 极市导读   就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了! 完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。 也就是说,真正的多模态AI模型,可能很快就要来了! >> 加入极市CV技术交流群,走在计算机视觉的最前沿 Transformer和Diffusion,终于有了一次出色的融合。 自此,语言模型和图像生成大一统的时代,也就不远了! 这背后,正是Meta最近发布的Transfusion——一种训练能够生成文本和图像模型的统一方法。 论文地址: https://arxiv.org/abs/2408.11039 英伟达高级科学家Jim Fan盛赞:之前曾有很多尝试,去统一Transformer和Diffusion,但都失去了简洁和优雅。 现在,是时候来一次Transfusion,来重新激活这种融合了! 在X上,论文共一Chu ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览