清华大学互联网产业研究院是2016年11月23日经清华大学正式批准成立的校级研究机构。清华大学互联网产业研究院在研究传统互联网的基础上,重点研究传统产业向互联网+转型的产业发展与创新,目标是把研究院办成具有广泛影响力的互联网产业研究机构。
今天看啥  ›  专栏  ›  清华大学互联网产业研究院

郑纬民院士:设计大模型基础设施需要考虑的五个问题

清华大学互联网产业研究院  · 公众号  ·  · 2024-08-29 11:48

文章预览

7月6日-8日,信百会2024年度研讨会在清华大学经济管理学院隆重举行。在本次年度研讨会主论坛上, 中国工程院院士,清华大学计算机系教授郑纬民作了题为《算力和存储是人工智能大模型的基座》的主题演讲。 他详细介绍了支持大模型训练的三种算力系统(基于英伟达公司 GPU 的系统、基于国产通用 GPU 芯片的系统、基于超级计算机的系统),以及人工智能大模型对存储的需求与挑战。他认为,设计大模型基础设施需要考虑五个问题:一是半精度运算性能与双精度运算性能的平衡,二是网络平衡设计,三是内存平衡设计,四是 IO 子系统平衡设计,五是如果是国产 AI 芯片的系统,还需要做好编程框架、并行加速等 10 个软件。“这五点如果做得好,别人要用 1 万块卡,我们用 9000 块卡就可以了。”他指出。 (本文根据郑纬民院士在信百会2024年度研 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览