专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

福州新闻网 · 雷军，中国新首富！ · 昨天

安徽省教育厅官微 · 合肥城市学院：以影为媒 ... · 昨天

FM1036福建新闻广播 · 太猛了！大涨600% · 昨天

中国商报 · 阿里巴巴重磅“炸场”！股价狂飙！ · 昨天

宏观大类资产配置研究 · 【国信策略】科技浪潮引领资产价值重估 · 2 天前

今天看啥 › 专栏 › AINLP

模型解释新方向！浙大揭秘LLM隐层之间的知识流动！

AINLP · 公众号 · · 2024-11-14 10:09

文章预览

作者：bhn 论文：https://arxiv.org/pdf/2405.17969 - NIPS2024 代码：https://github.com/zjunlp/KnowledgeCircuits 本文中： knowledge editing=知识编辑； machine unlearning=遗忘学习； detoxification=祛毒； knowledge circuits=知识回路；背景大量的参数赋予了大模型强大的能力的同时也带来了一些缺陷，如幻觉，不安全的行为。由于模型复杂的知识存储机制，这些问题的解决变得十分复杂。目前的工作进行两个方向的尝试，一种是认为事实以键值对的形式存储在mlp中，在这个基础上人们使用知识编辑，遗忘学习，祛毒等方法对模型的mlp层修改，以缓解修复模型的缺陷。另一种思路认为，知识不是单独的存储在某一区域的，而是由不同的组件共同构成的，本文中称为知识回路。这篇论文的工作分为四部分发现Transformer架构中的知识回路：解释知识回路的概念和知识回路是如何发 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

福州新闻网 · 雷军，中国新首富！

昨天

福州新闻网 · 雷军，中国新首富！

昨天

安徽省教育厅官微 · 合肥城市学院：以影为媒创新形式打造沉浸式思政教育"第二课堂"

昨天

安徽省教育厅官微 · 合肥城市学院：以影为媒创新形式打造沉浸式思政教育"第二课堂"

昨天

FM1036福建新闻广播 · 太猛了！大涨600%

昨天

FM1036福建新闻广播 · 太猛了！大涨600%

昨天

中国商报 · 阿里巴巴重磅“炸场”！股价狂飙！

昨天

中国商报 · 阿里巴巴重磅“炸场”！股价狂飙！

昨天

宏观大类资产配置研究 · 【国信策略】科技浪潮引领资产价值重估

2 天前

宏观大类资产配置研究 · 【国信策略】科技浪潮引领资产价值重估

2 天前

新经销 · 主论坛丨2024第六届中国快消品大会盛大开幕！

6 月前

工业能源圈 · 不被“机器狗之父”看好的人形机器人，未来要如何发展？

6 月前

上海发布 · 【探索】长三角的夜生活真是太全面了！一起去chill一下吧→

5 月前

中国计算机学会 · CCSP，浙师大赛场见！备考资料集锦来了

5 月前