绝对干货！NLP预训练模型：从transformer到albert

机器学习算法与自然语言处理 · 公众号 · · 2019-11-06 11:11

文章预览

文章作者：Serendipity 内容来源： Serendipity 的知乎（点击文末阅读原文即可关注）整理编辑：happyGirl 背景语言模型是机器理解人类语言的途径，17年的transformer是语言模型摆脱rnn，lstm建模的一次尝试，后续的bert则是大力出奇迹的代表，用更大的模型和更多的数据将nlp任务的benchmark提高了一大截。gpt在auto-regressive的路上一路走到黑，而xlnet将gpt和bert的优点结合在了一起，然后用更更大的数据吊打了bert。没过多久，bert的增强版roberta用更更更大的数据打败了xlnet。然而当bert的模型达到一定程度后，受到了硬件资源的限制，于是谷歌通过矩阵分解和参数共享压缩了bert的模型大小，因此当albert使用了和bert同样的参数量的时候，推理能力又上了一个台阶。正好最近这几个月也 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

禽报网 · 市场\\节后回落的空间有限？旺季不旺，淡季不淡或成为后续行情的写照！

5 天前

禽报网 · 鸭报•9-30\\苗价风云再起，又涨！冻品补缺为主，大货已结束！

6 天前

禽报网 · 消息\\山东益生再次引进两批2万套祖代白羽肉种鸡

6 天前

禽报网 · 冻品•9-30\\尘归尘，土归土！现在节日备货都比之前惯例晚了好久！

6 天前

禽报网 · 市场\\利好来了！多个原材料价格齐下跌，多家企业也纷纷宣布下调报价！

1 周前