前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

机器学习研究组订阅 · 公众号 · AI · 2024-07-21 16:34

文章预览

热衷于写博客的前谷歌科学家Yi Tay近日坐飞机太无聊，又撰写了一篇深度文章，探讨了当下很多人关心的一个话题——LLM时代模型架构的此消彼长和风云变幻。他上一篇自述创业辛酸史的博文就引发了业界的广泛关注，获得了Karpathy的转赞。这次Yi Tay试图解开在新的LLM时代里正在发生的所有事情，关于「BERT和T5发生了什么」？也关于Transformer encoder、PrefixLM和去噪目标的兴衰。博客地址：https://www.yitay.net/blog/model-architecture-blogpost-encoders-prefixlm-denoising 为何encoder-only模型「风光不再」？为何BERT这么强，却不能「scale it」？置身其中，很难看见事情的全貌。对于这些让业内人士都挠头的问题，Yi Tay分享了自己的观察和思考。而且Yi Tay还表示，这只是系列博客文章的第一弹，后续还可以期待他关于「LLM时代的模型架构」这一话题的更多内容。决定开始一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【Awesome Foundation Model ROS：一个-20241127130653

昨天

爱可可-爱生活 · XGrammar 通过巧妙地将 LLM 词汇表标记分类、利用自适-20241126053148

2 天前

爱可可-爱生活 · [CL]《Arithmetic Without Algorith-20241126053815

2 天前

爱可可-爱生活 · //@爱可可-爱生活：欢迎参与～-20241125073558

3 天前

爱可可-爱生活 · 【密歇根大学工程数学笔记：为工程师准备的实用数学参考手册，包含大-20241125083522

3 天前

保马 · 每日一书｜世界文明中的作物迁徙

1 月前

北美留学生观察 · 奢侈品万元高定，少量试产，百元到手！这要从你们盘活了一条时装产线说起……

1 月前