专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

LLM预训练和后训练新范式

AINLP · 公众号 · · 2024-08-21 10:58

文章预览

本文翻译自 Sebastian Raschka 的“New LLM Pre-training and Post-training Paradigms” ，他也是《Build a Large Language Model (from Scratch)》这本书的作者，强烈推荐一下，译者是知友 @铁头爱摆摊。原文： https://magazine.sebastianraschka.com/p/new-llm-pre-training-and-post-training 译文： https://zhuanlan.zhihu.com/p/715138042 大型语言模型（LLM）的发展已经取得了长足的进步，从早期的GPT模型到我们今天拥有的复杂的开放权重LLM。最初，LLM的训练过程仅集中于预训练，但后来扩展到包括预训练和后训练。后训练通常包括监督指令微调和对齐，这些是由ChatGPT普及的。自ChatGPT首次发布以来，训练方法已经发生了变化。在本文中，我回顾了最近几个月在预训练和后训练方法论方面的最新进展。本文讨论的新预训练和后训练方法论，概述了LLM开发和训练流程每个月都有数百篇LLM论文提出新技术和 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博