专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

Tom Yeh教授的DeepSeek专门讲座视频↓(就是那个用e-20250210182243

黄建同学  · 微博  · AI  · 2025-02-10 18:22
    

文章预览

2025-02-10 18:22 本条微博链接 Tom Yeh教授的DeepSeek专门讲座视频↓(就是那个用excel实现Transformer的厉害教授 网页链接 ) 讲座大纲: 1. Transformer 2. 注意力机制(Attention) - 自注意力机制(Self-Attention) - 多头注意力机制(Multi-Head Attention) - 多头潜在注意力机制(Multi-Head Latent Attention,DeepSeek) 3. 前馈网络(Feed-Forward) - 单专家(Single Expert) - 专家混合(Mixture of Experts, MoE) - 稀疏专家混合(Sparse Mixture of Experts) - 共享+路由 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览