这里是AI领域学习交流的平台!分享人工智能、机器学习、深度学习、计算机视觉、自然语言处理、算法原理、科技前沿、行业动态等,为您提供最有价值的知识和资讯。
今天看啥  ›  专栏  ›  人工智能与算法学习

Qwen2大模型微调入门实战(附完整代码)

人工智能与算法学习  · 公众号  ·  · 2024-06-19 15:41
    

文章预览

作者:林泽毅   编辑:AI生成未来 链接: https://zhuanlan.zhihu.com/p/702491999 Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。 以Qwen2作为基座大模型,通过指令微调的方式做高精度文本分类,是学习 LLM微调 的入门任务。 在本文中,我们会使用 Qwen2-1.5b-Instruct(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary) 模型在 复旦中文新闻 (https://modelscope.cn/datasets/huangjintao/zh_cls_fudan-news/summary)数据集上做指令微调训练,同时使用SwanLab监控训练过程、评估模型效果。 显存要求不高,10GB左右就可以跑。 代码: 完整代码直接看本文第5节 或 Github(https://github.com/Zeyi-Lin/LLM-Finetune),Jupyter Notebook(https://github.com/Zeyi-Lin/LLM-Finetune/blob/main/train_qwen2.ipynb) 实验日志过程: Qwen2-1.5B-Fintune - SwanLab(https://swanlab.cn/@Z ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览