专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

量子位  · 公众号  · AI  · 2023-11-06 10:30

文章预览

丰色 发自 凹非寺 量子位 | 公众号 QbitAI 国内 规模最大 的开源大模型来了: 参数650亿、基于2.6-3.2万亿token训练。 排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能 无条件免费商用 。 它就是来自深圳元象公司的XVERSE。 根据算力、资源限制和具体任务需求的不同,我们能对它进行任何自由修改或蒸馏。 除了规模大,它还具有16k上下文,支持40多种语言,并还有7B、13B两个版本可选。 具体什么来头? 国内规模最大的可商用大模型来了 研究表明,参数量越高,高质量训练数据越多,大模型性能才能不断提升。 而业界普遍共识是达到500到600亿参数门槛,大模型才能“智能涌现” ,在多任务中展现强大性能。 但训练此量级模型成本高昂,技术要求较高,目前主要为闭源付费提供。 在国外开源生态中,Llama2-70B和Falcon-180B等标杆模型为“有条件” ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览