专栏名称: EETOP
EETOP电子网(中国电子顶级开发网)是国内最顶级的电子行业工程师社区,涉及:嵌入式、智能硬件、半导体集成电路设计及制造等。 为您分享论坛精华内容、行业最新资讯、产品及技术 。 网址:www.eetop.cn bbs.eetop.cn
今天看啥  ›  专栏  ›  EETOP

英伟达非唯一选择:苹果借助谷歌TPU成功训练大型模型!

EETOP  · 公众号  · 硬件  · 2024-07-31 11:30
    

文章预览

苹果透露,它在开发最近发布的 Apple Intelligence 功能时并未使用 Nvidia 的硬件加速器。根据苹果官方的研究论文: machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf 苹果使用的是谷歌的 TPU 来处理训练数据,背后支持 Apple Intelligence 基础语言模型。 配备谷歌TPUv4和TPUv5芯片的系统在创建Apple Foundation Models(AFMs)过程中发挥了重要作用。这些模型,包括AFM-server和AFM-on-device模型,旨在为在线和离线Apple Intelligence功能提供支持,这些功能在 2024 年 6 月的全球开发者大会(WWDC)上得到了广泛宣传。 AFM-server 是苹果最大的 LLM,因此它仅在线使用。根据最近发布的研究论文,苹果的 AFM-server 在 8,192 个 TPUv4 芯片上训练,“分配为 8 × 1,024 芯片切片,这些切片通过数据中心网络(DCN)连接在一起。”预训练是一个三阶段过程,首先使用 6.3T 的 tokens, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览