专栏名称: NLP工作站
AIGC前沿知识分享&落地经验总结
今天看啥  ›  专栏  ›  NLP工作站

开源时代,沸腾期待

NLP工作站  · 公众号  ·  · 2024-05-31 21:54
    

文章预览

前两天刚刚打完价格战,又要开始开源战了。 前有阿里云,“敬请期待”。 后有智谱AI,“决定将开源更新的、更丰富能力的GLM模型”。 经过可靠消息,阿里应该是Qwen2.0系列模型将于下周开源,经过之前的Qwen和Qwen1.5系列,Qwen2.0应该也依然会是全套模型,但不确定下周是不是直接全发。 并且,可以期待Qwen2系列模型超过Llama3的效果。 再来说说ChatGLM系列模型。 其实ChatGLM应该是国内最早一批开源的模型了,但奈何只有6B尺寸的模型。在这个参数至上的时代,6B参数真不够看了。 分享之前的一个经历,就是在6B、7B规模上,训练了好长时间,指标一直达不到70,一度怀疑是不是自己的问题,然后32B模型随便一试,直接80+。 差距,赤裸裸的差距, 大的模型除了大全是优点,小的模型除了小全是缺点 。 群友们纷纷猜测,这波智谱开的是不是ChatGLM-6B或者Ch ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览