专栏名称: 机器学习初学者
号主黄博Github全球排名前90,3.6万Star!致力于为初学者提供学习路线和基础资料,公众号可以当作随身小抄,文章很全,建议收藏!点击菜单可以进入学习!
今天看啥  ›  专栏  ›  机器学习初学者

【NLP】关于大模型训练常见概念讲解

机器学习初学者  · 公众号  ·  · 2024-12-20 12:00
    

文章预览

随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调等方法也在不断更新。下面笔者根据资料整理一些关于大模型训练常见概念解释。 1 Pre-training(预训练) 预训练是指在模型的初始阶段,使用大量数据对模型进行训练,以便让模型学习到通用的特征和知识。这些特征和知识可以是语言模型中的词嵌入,或者是图像识别模型中的视觉模式。 通常发生在模型开发的早期阶段。 目的是在大规模数据集上学习通用特征,为后续任务奠定基础。 不针对特定任务,而是追求广泛的适用性。 2 Post-training(后训练) 后训练是指在预训练模型的基础上,针对特定的任务或数据集进行额外的训练。这个阶段通常涉及到微调(Fine-tuning),即调整预训练模型的参数以适应新的任务。 发生在预训练 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览