Qwen2大模型微调入门实战（附完整代码）

人工智能与算法学习 · 公众号 · · 2024-06-19 15:41

文章预览

作者：林泽毅编辑：AI生成未来链接： https://zhuanlan.zhihu.com/p/702491999 Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通义千问团队最近开源的大语言模型，由阿里云通义实验室研发。以Qwen2作为基座大模型，通过指令微调的方式做高精度文本分类，是学习 LLM微调的入门任务。在本文中，我们会使用 Qwen2-1.5b-Instruct(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary) 模型在复旦中文新闻 (https://modelscope.cn/datasets/huangjintao/zh_cls_fudan-news/summary)数据集上做指令微调训练，同时使用SwanLab监控训练过程、评估模型效果。显存要求不高，10GB左右就可以跑。代码：完整代码直接看本文第5节或 Github(https://github.com/Zeyi-Lin/LLM-Finetune)，Jupyter Notebook(https://github.com/Zeyi-Lin/LLM-Finetune/blob/main/train_qwen2.ipynb) 实验日志过程： Qwen2-1.5B-Fintune - SwanLab(https://swanlab.cn/@Z ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

兵团零距离 · 晚安·兵团 | 有梦想的人，不做选择题，只做证明题

10 小时前

兵团零距离 · 晚安·兵团 | 有梦想的人，不做选择题，只做证明题

10 小时前

三峡小微 · 媒体聚焦：清洁能源走廊、新能源产业支撑绿色转型感受长江水文化时代价值

昨天

河南商报 · 5天！郑州市提前启动春节鸡蛋蔬菜应急投放工作

昨天

水木纪要 · 水木调研纪要2.0来了，最低会员优惠活动来了！！

昨天

钱币收藏 · 小型张与小全张

3 天前

人文学学术资源在线 · 《浙江工商大学学报》2024年第5期目录

3 月前

德行天下新能源科技 · 【中秋佳节】月满人团圆，美好共此时

4 月前