Qwen2-VL微调工具

GitHubStore · 公众号 · · 2024-09-12 19:20

文章预览

项目简介 Qwen2-VL 很棒，相信很多人想在其上继续开发或者改造适配为VLA（Vision Language Action）模型（没错，改造为控制机器人的大模型），但官方在我写这个repo的时候，还没有给出一份简洁的微调或者再训练的代码。注：官访给了一个使用LLaMA-Factory方式微调Qwen2-VL的方法，我尝试了一下，发现LLaMA-Factory过于黑盒，概念很多，甚至有点冗余。我自己喜欢简单透明的代码，所以自己写了一份微调Qwen2-VL的代码，希望对喜欢自己写train-loop的同学有帮助。快速开始微调或者再训练Qwen2-VL 2B模型 % git clone https://github.com/zhangfaen/finetune-Qwen2-VL % cd finetune-Qwen2-VL % conda create --name qwen2-VL python=3.10 % conda activate qwen2-VL % pip install -r requirements.txt 我提供了2个微调脚本，一个用于单GPU训练，一个用于多GPU训练。本repo的目的是帮助大家快速上手微调Qwen2-VL，所以只准备了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

艾邦高分子 · 【邀请函】2024年第九届工程塑料创新应用论坛（12月12-13日深圳）

14 小时前

云南广播电视台 · 云南今年会是“冷冬”吗？下周，低温、雨雪齐“上线”……

22 小时前

云南网 · 昆明出租车或将降价！调整方案公布，主管部门征求意见……

昨天

高分子科学前沿 · 西南大学张贻川、深圳大学陈光明《AFM》：像皮肤一样柔软并具有“J型”应力-应变行为的复合热电材料用于自供电应变传感

5 天前

高分子科学前沿 · 仿生，最新Nature！

5 天前

中国企业家杂志 · 阿里出身的销售“铁军”盯上了折扣产品

3 月前