专栏名称: 甲子光年
甲子光年是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地。
今天看啥  ›  专栏  ›  甲子光年

端侧大模型火了,但CPU被低估了|甲子光年

甲子光年  · 公众号  ·  · 2024-06-18 11:50
    

文章预览

当前端侧推理的起点,未来端侧推理的支点。 作者|赵健 大模型火了之后,GPU也火了。一时间,GPU的持有量几乎成为了评估大模型成败的“度量衡”。 GPU很好,但不是大模型的全部。远比GPU诞生更早的中央处理器芯片——CPU,它在大模型中的地位可能被远远低估了。 尤其是在端侧大模型兴起之后,端侧推理越来越成为CPU的舞台。 过去大半年,端侧推理已经成为继“百模大战”之后下一个行业趋势,由此衍生的AI PC、AI手机等概念,也成为电脑厂商、手机厂商的兵家必争之地。 把大模型装在PC、手机或者其他硬件中,需要足够的算力来支撑,同时也需要兼顾效率和功耗。而CPU很可能是当前阶段端侧推理的算力最优解。  1.端侧大模型火了 今天,如果你想体验业内最领先的大模型对话助手,无论是OpenAI的ChatGPT,还是国内的Kimi、智谱清言等,都必须 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览