专栏名称: 集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
今天看啥  ›  专栏  ›  集智书童

快速学会AI核心架构,Transformer!

集智书童  · 公众号  ·  · 2024-11-19 09:00
    

文章预览

大家好,今天从头讲一个人工智能非常核心的架构——Transformer! Transformer模型由 编码器(Encoder) 和 解码器(Decoder) 两部分组成。 其中,编码器和解码器各由 N 个相同的层叠加而成的。 编码器有两个子层。分别是 多头自注意力(multi-head self-attention) 和 基于位置的前馈网络(positionwise feed-forward network) 。 解码器有三个子层。除了多头自注意力和前馈网络外,解码器还在这两个子层之间插入了第三个子层,称为 编码器-解码器注意力(encoder-decoder attention) 层。 这里也分享我整理的 226篇Transformer顶会论文合集 ,包括训练transformer、卷积transformer、VIT等多个细分领域。 扫码即可无偿领取! Transformer架构中的核心概念包括: 自注意力机制(Self-Attention): Transformer模型的核心组成部分,允许模型在处理一个单词时同时考虑句子中的其他单词,从 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览