文章预览
一家大模型厂商,半年加速进化。 文丨猎云精选 ID:lieyunjingxuan 作者丨孙媛 行至2024,云端大模型还未分出胜负,端侧模型早已硝烟四起。 去年上半年,谷歌以可在移动设备上离线运行的PaLM2轻量级选手“壁虎”打响了端侧模型第一枪,到了年底,端侧模型时代的大幕就被缓缓拉起。 法国创企Mistral AI率先发布Mixtral 8x7B模型,微软更是半年时间加速跑,从27亿参数的Phi-2到SLM(小语言模型)Phi-3系列,以“便宜得多,但响应能力接近比它大10倍的模型”强调高性价比。 Google携带Gemma模型向Meta的Llama-2大模型发起挑战,苹果也以“小模型”家族宣告离“让人工智能在苹果设备上本地运行”目标更近一步。 而大洋彼岸的另一侧,在中国上海张江,也有这么一家通用大模型厂商,驶上了端侧模型的快车道,以类脑分区激活的工作机制、改进反向传播算法逐步
………………………………