专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
目录
今天看啥  ›  专栏  ›  AINLP

【LLM数据工程】LLMs-数据构造-Self-Instruct总结v3.0

AINLP  · 公众号  ·  · 2024-08-14 18:00

文章预览

【导读】:本文是LLM数据工程第三篇,介绍微调数据构造框架Self-Instruct的工作原理和具体实现。同时,介绍 Alpaca,具体有 Alpaca的 训练流程、微调数据生成以及微调数据生成的代码解析。最后, 介绍 Alpaca微调训练的主要代码。 Self-Instruct框架 和Alpaca模型 【1】 Self-Instruct框架 Self-Instruct: Aligning Language Models with Self-Generated Instructions 论文地址: https://arxiv.org/pdf/2212.10560.pdf Github地址:https://github.com/yizhongw/self-instruct Cool paper:https://papers.cool/arxiv/search?highlight=1 =self+instruct 【2】Alpaca模型相关 Alpaca: A Strong, Replicable Instruction-Following Model Blog链接:https://crfm.stanford.edu/2023/03/13/alpaca.html Github地址: https://github.com/tatsu-lab/stanford_alpaca Self-Instruct 论文解读 【1】Self-Instruct的论文摘要 Self-Instruct 提出背 景: 1. 人工编写 指令数据的质量和数量 影响 微调模型的表现。 2. ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览