定期分享机器学习领域原创文章,公众号内容涵盖了机器学习算法和python数据分析等文章,目前监督学习方法的文章应有尽有,非监督学习的原创文章一直在更新,欢迎机器学习爱好者和从业者的加入,互相学习,共同成长。
今天看啥  ›  专栏  ›  机器学习算法那些事

校招生做大模型,选预训练还是SFT?

机器学习算法那些事  · 公众号  ·  · 2024-09-08 09:23

文章预览

作者:ybq 链接:https://www.zhihu.com/question/635761315/answer/3608088928 我推荐选 pretrain,理由如下: pretrain 提高工程能力,sft 提高认知能力 作为校招新人,你的当务之急只有一条: 提升工程代码能力! 我们拆解一下两个团队所需要的技能,你判断下哪个提升代码能力更快。 在 pretrain 团队,你的必修课有:爬取互联网数据,大规模数据清洗与去重(hadoop、spark等),配置各种 torch 和 cuda 环境,搞懂、修改、优化 megatron 的代码,熟练 debug 多机通讯报错,成熟的炼丹技巧(数据配比,学习率,优化器,课程学习,分析 loss 曲线、scaling_law),跑通各 benchmark 验证模型能力; 在 sft 团队,训练框架和炼丹技巧只属于选修课,往往公司不给你时间学习,你的必修课大概只包含以下内容:手动标数据,用 gpt4 标数据,教会标注人员标数据,利用用户反馈标数据,根 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览