专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

LLM实践--支线：拯救Continue Pretrain的数据

深度学习自然语言处理 · 公众号 · · 2024-10-17 23:55

文章预览

知乎：真中合欢链接：https://zhuanlan.zhihu.com/p/721492096 打分清洗的文章难产，写起来没有思路，就换换脑子写写旁门左道，探讨一下common数据质量不理想的情况下，如何做一个还可以的Continue Pretrain。背景首先介绍下什么是Continue Pretrain（CP）。CP 和 Pretrain、SFT一样指的是 LLM 训练的一个阶段，在前大模型时代还被称作Post Pretrain。CP 是在Pretrain和SFT之间的训练阶段，目的是为模型注入领域知识，这个领域是泛指的领域，既包含金融、法律、创作这种学科领域，也包含推理、理解这种能力领域。现在很多论文工作都说明了我们的通用基座模型还没有达到各个尺寸模型的上限，也就是我们的模型还能学习更多知识，进行更准确的推理。但是做法却并不容易，简单的next token loss + generate 已经无法满足要求了。但是如果只求提升某一方面的能力，那在某一个 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

普象工业设计小站 · 日本奇葩创意：巨型螃蟹被子！！网友惊呼：这睡得着吗？

7 小时前

创业家 · 女儿亏掉30亿，浙江大佬坐不住了

20 小时前

质量与认证 · 名单 | 这一检验检测领域科学技术奖，揭晓！

3 天前

质量与认证 · 名单 | 这一检验检测领域科学技术奖，揭晓！

3 天前

科技兽 · 传闻苹果 iPhone 17 Air 厚度约 6 毫米，有望成为史上最薄 iPhone

4 天前

科技兽 · 传闻苹果 iPhone 17 Air 厚度约 6 毫米，有望成为史上最薄 iPhone

4 天前

投资界 · 200亿，北京今年最大一笔融资

4 天前

投资界 · 200亿，北京今年最大一笔融资

4 天前

南都周刊 · 小南早报 | 萝卜快跑进入广州；主播不打码对准乘客直播？深圳地铁回应；雷军发文“美丽小废物”引猜疑

4 月前

广州房产 · 超车黄埔，黑马开盘卖爆，花都这波赢麻了

3 月前

洁净工程联盟 · 一文搞懂新风机组MAU

3 月前