盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

机器之心 · 公众号 · AI · 2024-07-22 13:25

文章预览

机器之心报道编辑：Panda 编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？在大型语言模型（LLM）领域，现在是仅解码器模型（如 GPT 系列模型）独领风骚的时代。那编码器 - 解码器或仅编码器模型发展如何呢？为什么曾经盛名一时的 BERT 却渐渐少有人关注了？近日，AI 创业公司 Reka 的首席科学家和联合创始人 Yi Tay 发布了一篇博客文章，分享了他的看法。Yi Tay 在参与创立 Reka 之前曾在 Google Research 和谷歌大脑工作过三年多时间，参与过 PaLM、UL2、Flan-2、Bard 等著名 LLM 以及 PaLI-X 和 ViT-22B 等多模态模型的研发工作。以下为他的博客文章内容。基础简介总体上看，过去这些年的 LLM 模型架构主要分为三大范式：仅编码器模型（如 BERT）、编码器 - 解码器模型（如 T5）、仅解码器模型（如 GPT 系列模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · [CL]《Ordered Semantically Divers-20250318053906

20 小时前

爱可可-爱生活 · [CL] A Survey on Knowledge-Orien-20250318055539

19 小时前

爱可可-爱生活 · 《爱可可微博热门分享(3.16)》爱可可微博热门分享(3.1-20250316231153

2 天前

爱可可-爱生活 · 本文提出了一种极其简洁有效的动态Tanh (DyT) 操作，作为-20250315054439

3 天前

爱可可-爱生活 · [CL]《KV-Distill: Nearly Lossless-20250315062206

3 天前

白帽子左一 · 一些APP渗透测试时的小tips

9 月前

每日学英语 · 这就是传说中的奶油小生！

9 月前

田俊国讲坛 · 每个系统都需要明白人

7 月前

通商律师事务所 · 2024 ALB通商十五佳新科技公司法务团队颁奖典礼圆满举行

5 月前

科普中国 · 我国患者约占全球40%！警惕这一“喂”出来的癌症！

3 月前