专栏名称: 自动驾驶之星

自动驾驶之星，是一个以自动驾驶量产交流为主的社区。这里有自动驾驶量产第一线的前沿动态，有一群奋斗在自动驾驶量产第一线的小伙伴在分享他们的量产经历。期待你的加入！希望每个人在这个浪潮中都能成为自动驾驶之星！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大模型中LLM训练技巧(干货满满！！)- SFT

自动驾驶之星 · 公众号 · · 2024-10-09 08:25

文章预览

作者：ybq 链接：https://zhuanlan.zhihu.com/p/809229182 点击下方卡片，关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶量产第一线的小伙伴等你加入背景篇这里先普及一些 sft 涉及到的基础概念，方便新人同学理解后续内容，老同学则可以跳过这一篇章。 Special Token pretrain 阶段完全没见过的 token，在sft 阶段会被赋予全新的语义。主要用于标注对话的角色：user、assistant、system 这些。此外，special_token 可以用来“构造知识”，比如" 喜欢 "这种知识一定是 sft 阶段才会见到的，可以剔除掉 pretrain 先验知识的影响，用来验证 sft 的训练情况，比如会不会过拟合。我默认大家都知道怎么用 special_token 去拼 prompt，如果不熟悉，看下 tokenizer_config.json 里的"chat_template"这个字段也就懂了。耗时问题模型的预测时间可以近似理解为： y = k x + b " role="presentation" style=" ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博