今天看啥  ›  专栏  ›  奇客Solidot

1 位大模型或能解决 AI 的能源需求问题

奇客Solidot  · 公众号  ·  · 2024-06-02 09:51
    

文章预览

大模型正变得越来越强大,但对计算和电力的需求也越来越大。大模型如果要变得廉价、快速而且环保,它们需要大幅缩小规模,以便于能在类似手机的设备上本地运行。研究人员正致力于寻找方法实现这一目标。类似所有神经网络,大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。有两种压缩网络的通用方法,其一是训练后量化(PTQ),其二是量化感知训练(QAT),研究人员更青睐前者。哈工大的车万翔称,PTQ 相对于 QAT 的优点是不需要收集训练数据,不需要重新训练,训练过程更稳定。QAT 的优点则是模型可能更精确,因为量化从一开始就内置在模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览