注册登录

专栏名称: 智见AGI

神州问学公众号是围绕生成式AI技术的交流社区，与开发者和合作伙伴共同探究有深度的生成式AI技术前沿洞见、技术迭代、案例解析、方法和实践，助力企业的数字化转型

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

目录

相关文章推荐

宝玉xp · 比 Sora ... · 12 小时前

爱可可-爱生活 · [CL]《The Sparse ... · 16 小时前

黄建同学 · 值得每天看一节↓程序员应该知道的97件事-2 ... · 昨天

AI前线 · 来薅 OpenAI 羊毛！Deep ... · 昨天

黄建同学 · 这图做得好清晰↓什么是 AI ... · 2 天前

今天看啥 › 专栏 › 智见AGI

Why decoder-only? LLM架构的演化之路

智见AGI · 公众号 · · 2024-07-12 15:32

文章预览

如何根据大模型架构进行选型 ©作者 | Zhongmei 来源 | 神州问学引言本文想为大型语言模型（LLMs）及其下游自然语言处理（NLP）任务的实践者和用户提供一份全面且实用的指南。将从模型架构的角度出发，对比不同架构的特点，希望可以从最底层给大模型选型一些参考意见。以及针对大模型架构的演变过程做出探究，分析decoder-only成为主流架构背后的原因。大模型常见架构 LLM（大型语言模型）的架构命名某种程度上是混乱而反常的。所谓的“decoder-only（仅解码器）”实际上意味着“自回归编码器-解码器”。“encoder only（仅编码器）” 实际上包含一个编码器和解码器（非自回归），而所谓的“encoder-decoder（编码器-解码器）”真实含义是”自回归编码器-解码器“ —— Yann Lecun 这个小节会简要介绍常见的不同的大模型的模型架构和用例。目前比较 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 比 Sora 画的好看多了，中文还是即梦更强-20250426094835

12 小时前

爱可可-爱生活 · [CL]《The Sparse Frontier: Sparse-20250426055208

16 小时前

黄建同学 · 值得每天看一节↓程序员应该知道的97件事-20250425211809

昨天

AI前线 · 来薅 OpenAI 羊毛！Deep Research 轻量版 0 元畅玩，o4-mini 实力支持

昨天

黄建同学 · 这图做得好清晰↓什么是 AI Agent？AI代理是一种软件程序-20250424181550

2 天前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号