注册
登录
专栏名称:
AINLPer
一个专注自然语言处理(NLP)方向的公众号。机器学习(ML)、深度学习(DL)、自然语言处理相关模型理解、热门论文(Paper)分享分析、pytorch、C++、Python、Java ...
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
青海公安
·
致敬每一份坚守……#除夕#节日我在岗#坚守不打烊
·
4 天前
青海公安
·
致敬每一份坚守……#除夕#节日我在岗#坚守不打烊
·
4 天前
今天看啥
›
专栏
›
AINLPer
Meta | 提出System 2蒸馏方法,Llama 2对话模型任务准确率接近100%!
AINLPer
·
公众号
· · 2024-07-14 22:01
文章预览
点击上方 “ AINLPer “ ,设为 星标 更多干货,第一时间送达 研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能。 谈到大语言模型(LLM)的策略,一般来说有两种,一种是即时的 System 1(快速反应),另一种是 System 2(慢速思考)。 其中 System 2 推理倾向于深思熟虑的思维,生成中间思维允许模型(或人类)进行推理和规划,以便成功完成任务或响应指令。在 System 2 推理中,需要付出努力的心理活动,尤其是在 System 1(更自动化思维)可能出错的情况下。 因此,System1 被定义为 Transformer 的应用,可以根据输入直接生成响应,而无需生成中间 token。Sytem 2 被定义为生成中间 token 的任何方法,包括执行搜索或多次提示然后最终生成响应的方法。 业界已经提出了一系列相关 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
青海公安
·
致敬每一份坚守……#除夕#节日我在岗#坚守不打烊
4 天前
青海公安
·
致敬每一份坚守……#除夕#节日我在岗#坚守不打烊
4 天前
华泰睿思
·
华泰 | 近期交运板块的三条投资主线
4 月前
清北资源
·
经纬创投 硬科技投资实习生招聘(400/天)
2 月前