文章预览
7月6日-8日,信百会2024年度研讨会在清华大学经济管理学院隆重举行。在本次年度研讨会主论坛上, 中国工程院院士,清华大学计算机系教授郑纬民作了题为《算力和存储是人工智能大模型的基座》的主题演讲。 他详细介绍了支持大模型训练的三种算力系统(基于英伟达公司 GPU 的系统、基于国产通用 GPU 芯片的系统、基于超级计算机的系统),以及人工智能大模型对存储的需求与挑战。他认为,设计大模型基础设施需要考虑五个问题:一是半精度运算性能与双精度运算性能的平衡,二是网络平衡设计,三是内存平衡设计,四是 IO 子系统平衡设计,五是如果是国产 AI 芯片的系统,还需要做好编程框架、并行加速等 10 个软件。“这五点如果做得好,别人要用 1 万块卡,我们用 9000 块卡就可以了。”他指出。 (本文根据郑纬民院士在信百会2024年度研
………………………………