专栏名称: EETOP
EETOP电子网(中国电子顶级开发网)是国内最顶级的电子行业工程师社区,涉及:嵌入式、智能硬件、半导体集成电路设计及制造等。 为您分享论坛精华内容、行业最新资讯、产品及技术 。 网址:www.eetop.cn bbs.eetop.cn
今天看啥  ›  专栏  ›  EETOP

数据中心中的 AI 推理:打破效率与成本的权衡

EETOP  · 公众号  · 硬件  · 2025-02-13 12:18
    

文章预览

训练和推理包括数据中心 AI 处理的两个关键方面。了解两者之间的区别,以及所涉及的成本效益问题。 在数据中心执行人工智能 (AI) 工作负载(图 1)涉及两个关键过程:训练和推理。乍一看,这些过程似乎很相似 — 都涉及读取数据、处理数据和生成输出。仔细检查会发现它们之间存在显着差异。   图 1. 在 AI 工作负载需求的推动下,数据中心的计算需求持续飙升。 数据中心中的训练与推理:主要差异 以具有数千亿甚至数万亿个参数的大型语言模型 (LLM) 为例,AI 模型的复杂性呈爆炸式增长,这推动了对训练和推理的前所未有的计算需求。然而,它们的运营要求和优先事项却大相径庭。 计算性能 训练是一个计算量非常大的过程,需要 ExaFLOPS 的能力来分析和提取大量(通常是非结构化数据集)中的模式。此过程可能持续数周甚至数月,因 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览