专栏名称: 江大白
专业有趣的AI内容平台,关注后回复【算法】,获取45家大厂的《人工智能算法岗江湖武林秘籍》
今天看啥  ›  专栏  ›  江大白

万字长文,深入浅出Transformer,值得收藏!

江大白  · 公众号  ·  · 2024-07-08 08:00

文章预览

以下 文 章来源于微信公众号: 算法美食屋 作者: 梁云1991 链接:https://mp.weixin.qq.com/s/iBVNkvfz8usZTpPLRcghRA 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 随着大模型、多模态的爆火,Transformer 占据着越来越重要的地位,也包括了NLP和CV领域。对此我们用一篇文章搞定有关Transformer的全部内容,不管是理论的还是工程,值得点赞收藏! 前方干货预警:这可能是你能够找到的 最容易懂 的 最具实操性 的 最系统 的学习transformer模型的入门教程。 我们 从零开始用pytorch搭建Transformer模型 ( 中文可以翻译成 变形金刚 )。 训练它来实现一个有趣的实例:两数之和。 输入输出类似如下: 输入:" 12345+54321 " 输出:" 66666 " 我们把这个任务当做一个机器翻译任务来进行。输入是一个字符序列,输出也是一个字符序列(seq-to-seq). 这和机器翻译的输入输 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览