注册登录

专栏名称: NLP工作站

AIGC前沿知识分享&落地经验总结

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

昆明广播电视台 · 宣告停运，可申请退款！ · 昨天

昆明广播电视台 · 宣告停运，可申请退款！ · 昨天

掌中淄博 · 官宣：部分停服！曾经火爆全网 · 昨天

掌中淄博 · 官宣：部分停服！曾经火爆全网 · 昨天

今天看啥 › 专栏 › NLP工作站

浅谈-领域模型训练

NLP工作站 · 公众号 · · 2024-08-07 12:12

文章预览

今天给大家带来知乎好友@ybq一篇关于如何进行领域模型训练的文章，主要内容是对 post-pretrain 阶段进行分析，后续的 Alignment 阶段就先不提了，注意好老生常谈的“数据质量”和“数据多样性”即可。原文：https://zhuanlan.zhihu.com/p/711537210 Qwen2：https://arxiv.org/abs/2407.10671 MiniCPM：https://shengdinghu.notion.site/MiniCPM-c805a17c5c8046398914e47f0542095a Llama3.1：https://arxiv.org/abs/2407.21783 什么是领域模型？领域模型为什么需要专门做 post-pretrain 训练，alignment 阶段不够吗？简单来说，领域模型 / 专家模型就是在某一个专业领域性能特别好的模型，可能包括法律、医学、教育、role-play 等等。一般来说，领域模型比较重要的环节是 RAG，我们需要有一个特别高精的检索库，来辅助模型做一些专业的回答。这也就是说，做好 sft 和 ppo 似乎就可以了？其实，这么想也基本正确，因 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

昆明广播电视台 · 宣告停运，可申请退款！

昨天

昆明广播电视台 · 宣告停运，可申请退款！

昨天

掌中淄博 · 官宣：部分停服！曾经火爆全网

昨天

掌中淄博 · 官宣：部分停服！曾经火爆全网

昨天

中国机电产品进出口商会 · 邀请 | “汽车行业的绿色未来与法治新征程”研讨会

2 月前

正和岛 · 好企业，都是“熬”出来的

2 月前

港澳IPO上市 · 新世纪储运，成功于12月18日在美国上市丨美国IPO市场

2 月前

求职汇 · 找不到工作的应届毕业生，也不找对象了

2 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号