专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

四个大模型轻量级微调训练框架：兼看PPT转Markdown工具

老刘说NLP · 公众号 · · 2024-07-28 12:03

文章预览

今天是2024年7月27日，星期六，北京，天气雨。今天来看两个问题：一个是当前的四个微调训练框架，可以看看各自的特点。一个是文档智能工具-PPT转Markdown工具的一些实现逻辑，实现都很简单。供大家一起参考并思考，持续学习，做原理性的思考。问题1：当前的四个微调训练框架 1、Firefly 地址：https://github.com/yangjianxin1/Firefly 其给出了训练数据的情况：支持预训练、指令微调、DPO，支持全量参数训练、LoRA、QLoRA高效训练。通过配置文件的方式训练不同的模型，小白亦可快速上手训练模型。支持使用Unsloth加速训练，并且节省显存。支持绝大部分主流的开源大模型，如Llama3、Gemma、MiniCPM、Llama、InternLM、Baichuan、ChatGLM、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral-8x7B、Zephyr、Vicuna、Bloom，训练时与各个官方的chat模型的template对齐。整理并 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博