专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

大型语言模型(LLMs),附Slides与视频

专知  · 公众号  ·  · 2024-07-01 17:00
    

文章预览

本教程全面介绍了大型语言模型(LLMs)的基本概念、构建过程和应用实例,涵盖了以下几个方面: LLMs的基本概念 : 定义及区别:介绍了LLMs、语言模型(LM)和预训练语言模型(PLM)之间的区别,强调了LLMs的多用途和涌现能力。 语言模型的目标:包括困惑度(perplexity)等指标的定义和计算方法。 LLMs的构建过程 : 数据准备:强调了数据源的选择、数据清洗和分词的重要性。 预训练:讨论了大规模数据预训练的过程和成本。 微调与对齐:介绍了指令微调、强化学习人类反馈(RLHF)等技术,讨论了模型对齐与人类价值的关系。 流行的LLM实现概述 : 对多个著名的LLM模型(如GPT-4、Llama等)进行比较,分析它们的架构、参数规模和训练成本。 介绍了开源模型和封闭模型在研究和部署中的选择和考虑因素。 高级话题的快速采样 : 高效推理与服务: ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览