专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

LlamaFactory 一键式LLM训练、微调工具介绍与实践

AINLP  · 公众号  ·  · 2024-06-20 09:44
    

文章预览

作者:LeonYi,四川大学 计算机技术硕士 声明:本文只做分享,版权归原作者 整理:青稞AI 原文:https://zhuanlan.zhihu.com/p/697773502 一、LlamaFactory介绍 LlamaFactory 是一个封装比较完善的LLM微调工具,它能够帮助用户快速地训练和微调大多数LLM模型。 https://github.com/hiyouga/LLaMA-Factory 1.1 简介 LlamaFactory架构 LlamaFactory主要通过Trainer类来实现训练流程,通过设置数据集、模型选型、训练类型、微调超参、模型保存,以及训练状态监控等信息,来开启训练。 支持的训练方法 支持的训练方法(这里的Pre-Training指的是增量预训练) LlamaFactory和其他框架对比 LlamaFactory基于PEFT和TRL进行二次封装,从而可以快速开始SFT和RLHF微调。同时,引入GaLore和Unsloth等方案,能降低训练显存占用。 1.2 特性 •  各种模型 : LLaMA, LLaVA, Mistral, Mixtral-MoE, Qwen, Yi, Gemma, Baichuan, ChatGLM, Phi, etc. ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览