专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

四个大模型轻量级微调训练框架:兼看PPT转Markdown工具

老刘说NLP  · 公众号  ·  · 2024-07-28 12:03

文章预览

今天是2024年7月27日,星期六,北京,天气雨。 今天来看两个问题: 一个是 当前的四个微调训练框架,可以看看各自的特点 。 一个是 文档智能工具-PPT转Markdown工具的一些实现逻辑 ,实现都很简单。 供大家一起参考并思考,持续学习,做原理性的思考。 问题1:当前的四个微调训练框架 1、Firefly 地址:https://github.com/yangjianxin1/Firefly 其给出了训练数据的情况: 支持预训练、指令微调、DPO,支持全量参数训练、LoRA、QLoRA高效训练。通过配置文件的方式训练不同的模型,小白亦可快速上手训练模型。 支持使用Unsloth加速训练,并且节省显存。 支持绝大部分主流的开源大模型,如Llama3、Gemma、MiniCPM、Llama、InternLM、Baichuan、ChatGLM、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral-8x7B、Zephyr、Vicuna、Bloom,训练时与各个官方的chat模型的template对齐。 整理并 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览