文章预览
作者:丁华 黄威 陈岱源 一、通义千问开源大模型简介 通义千问是由阿里巴巴集团旗下的云计算服务公司阿里云开发的大语言模型。2023年8月3日,阿里云宣布其自研的大模型通义千问正式开源,并在AI模型社区魔搭ModelScope上架了两款开源模型——Qwen-7B和Qwen-7B-Chat,随后在2023年相继发布了Qwen-1_8B、Qwen-72B 和 Qwen-Audio。Qwen-7B、Qwen-72B和Qwen-7B-Chat采用《Tongyi Qianwen LICENSE AGREEMENT》,Qwen-1_8B采用《Tongyi Qianwen RESEARCH LICENSE AGREEMENT》[1]。 2024年4月28日,阿里云发布了Qwen-1.5系列大模型。2024年6月,阿里云发布了Qwen-2系列大模型,包含Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B共五个版本。其中Qwen2-72B曾在2024年6月登顶HuggingFace排行榜,力压Meta的Llama-3-70B开源模型。同时,在上海人工智能实验室联合魔搭社区推出的中国大语言模型评测竞技场Compass Arena测评中
………………………………