注册登录

专栏名称: 机器学习初学者

号主黄博Github全球排名前90，3.6万Star！致力于为初学者提供学习路线和基础资料，公众号可以当作随身小抄，文章很全，建议收藏！点击菜单可以进入学习！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

质安选 · 食品工厂洗手液的正确选择 · 2 天前

质安选 · 食品抽检危机管理大作战！（上）——预警机制： ... · 2 天前

李峰的投资圈 · 个人一定要存些美元 · 5 天前

李峰的投资圈 · 个人一定要存些美元 · 5 天前

天天看余杭 · 紧急通报：彻查！央视曝光，网友懵了：正在吃 · 5 天前

今天看啥 › 专栏 › 机器学习初学者

【NLP】AAAI21最佳论文Runners Up！Transformer的归因探索！

机器学习初学者 · 公众号 · · 2021-04-20 11:00

文章预览

作者：一元，四品炼丹师 Self-Attention Attribution: Interpreting Information Interactions Inside Transformer（AAAI21）问题背景在之前大家对于Transformer的理解都是，Transformer的成功得益于强大Multi-head自注意机制，从输入中学习token之间的依赖关系以及编码上下文信息。我们都很难解释输入特性如何相互作用以实现预测的。Attention计算得到的分数也并不能完美的解释这些交互作用，本文提出一种自我注意归因方法来解释Transformer内部的信息交互。我们以Bert为例进行研究。首先，我们利用自我注意归因来识别重要的注意头，其它注意头会随着边际效果的下降而被剪掉。此外，我们提取了每个层中最显著的依赖关系，构造了一个属性树，揭示了Transformer内部的层次交互。最后，我们证明了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

质安选 · 食品工厂洗手液的正确选择

2 天前

质安选 · 食品抽检危机管理大作战！（上）——预警机制：未雨绸缪的艺术

2 天前

李峰的投资圈 · 个人一定要存些美元

5 天前

李峰的投资圈 · 个人一定要存些美元

5 天前

天天看余杭 · 紧急通报：彻查！央视曝光，网友懵了：正在吃

5 天前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号