专栏名称: NVIDIA企业开发者社区

NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台，通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

快无止尽! FasterTransformer 2.0 让 Decoder 不再是你的性能瓶颈。

NVIDIA企业开发者社区 · 公众号 · · 2020-02-17 12:02

文章预览

介绍自从 “Attentionis All You Need” 在2017年提出以来至今，Transformer 已经成为 NLP 领域中一个非常热门的架构。而在2019年7月，我们团队开源了 FasterTransformer 1.0，针对 BERT 中的 Transformer Encoder 进行优化和加速，以满足在线业务的低延迟要求。在解决了 Transformer Encoder 的性能问题之后，我们将重点放到了同样重要的 Transformer Decoder 推理上。在众多基于 Encoding-Decoding 的 NLP 应用推理，有百分之九十以上的时间是消耗在 Decoder 上面。因此，我们在 FasterTransformer1.0 版本的基础上，推出了2.0的版本，增加了针对 Decoder 的优化。其优越的性能将助力于翻译，对话机器人，文字补全修正等多种生成式的场景。 FasterTransformer2.0 的底层由 CUDA 和 cuBLAS 实现，支持 FP16 和 FP ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博