专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

微调神器LLaMA-Factory官方保姆级教程来了,从环境搭建到模型训练评估全覆盖

AINLP  · 公众号  ·  · 2024-07-04 23:05
    

文章预览

编者注 : 之前一直用firefly做微调,最近切换到LLaMA-Factory,发现不但简单易用,而且非常全面,有点相见恨晚的感觉。使用过程中我主要参考2个文档,一个是github上的官方中文文档: https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md 另外一个是官方在知乎上的" LLaMA-Factory QuickStart",以下来自于这篇 QuickStart,"AI工程化"之前做得整理,不过注意官方文档会同步更新的: https://zhuanlan.zhihu.com/p/695287607 1. 项目背景 开源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用数据进行训练而来,其对于不同下游的使用场景和垂直领域的效果有待进一步提升,衍生出了微调训练相关的需求,包含预训练(pt),指令微调(sft),基于人工反馈的对齐(rlhf)等全链路。但大模型训练对于显存和算力的要求较高,同时也需要下游开发者对大模型本身的技术有一定了解, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览