文章预览
【导读】:本文是LLM数据工程第三篇,介绍微调数据构造框架Self-Instruct的工作原理和具体实现。同时,介绍 Alpaca,具体有 Alpaca的 训练流程、微调数据生成以及微调数据生成的代码解析。最后, 介绍 Alpaca微调训练的主要代码。 Self-Instruct框架 和Alpaca模型 【1】 Self-Instruct框架 Self-Instruct: Aligning Language Models with Self-Generated Instructions 论文地址: https://arxiv.org/pdf/2212.10560.pdf Github地址:https://github.com/yizhongw/self-instruct Cool paper:https://papers.cool/arxiv/search?highlight=1 =self+instruct 【2】Alpaca模型相关 Alpaca: A Strong, Replicable Instruction-Following Model Blog链接:https://crfm.stanford.edu/2023/03/13/alpaca.html Github地址: https://github.com/tatsu-lab/stanford_alpaca Self-Instruct 论文解读 【1】Self-Instruct的论文摘要 Self-Instruct 提出背 景: 1. 人工编写 指令数据的质量和数量 影响 微调模型的表现。 2.
………………………………