注册
登录
专栏名称:
黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
宝玉xp
·
“多写点文字记录给未来的养老机器人输入数据” ...
·
20 小时前
新智元
·
清华姚班校友等揭Transformer致命缺 ...
·
昨天
宝玉xp
·
马斯克说中国有很多聪明积极的工程师,未来会带 ...
·
2 天前
宝玉xp
·
转发微博-20250209002023
·
2 天前
量子位
·
奥特曼再谈DeepSeek:肯定开源模型巨大 ...
·
3 天前
今天看啥
›
专栏
›
黄建同学
Tom Yeh教授的DeepSeek专门讲座视频↓(就是那个用e-20250210182243
黄建同学
·
微博
·
AI
· 2025-02-10 18:22
文章预览
2025-02-10 18:22 本条微博链接 Tom Yeh教授的DeepSeek专门讲座视频↓(就是那个用excel实现Transformer的厉害教授 网页链接 ) 讲座大纲: 1. Transformer 2. 注意力机制(Attention) - 自注意力机制(Self-Attention) - 多头注意力机制(Multi-Head Attention) - 多头潜在注意力机制(Multi-Head Latent Attention,DeepSeek) 3. 前馈网络(Feed-Forward) - 单专家(Single Expert) - 专家混合(Mixture of Experts, MoE) - 稀疏专家混合(Sparse Mixture of Experts) - 共享+路由 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
宝玉xp
·
“多写点文字记录给未来的养老机器人输入数据”这是个好思路😄👍-20250211011133
20 小时前
新智元
·
清华姚班校友等揭Transformer致命缺陷,OpenAI科学家紧急回应:学术界节奏太慢
昨天
宝玉xp
·
马斯克说中国有很多聪明积极的工程师,未来会带来很多像 DeepS-20250209085109
2 天前
宝玉xp
·
转发微博-20250209002023
2 天前
量子位
·
奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
3 天前
Z Potentials
·
独家 | AI 搜索,24年的第一个战局,谁是隐藏王者?
8 月前
大悟新闻
·
9个方面、37项具体内容!湖北应急管理执法队伍建设规范出炉→
7 月前
安徽省发展改革委
·
安徽省新能源汽车产业集群建设企业巡展——【243】安徽利众光电科技有限公司
1 月前
数字经济法律圈
·
利用“内保外贷”实现资金跨境流通的法律风险
2 周前