专栏名称: EETOP

EETOP电子网(中国电子顶级开发网）是国内最顶级的电子行业工程师社区，涉及：嵌入式、智能硬件、半导体集成电路设计及制造等。为您分享论坛精华内容、行业最新资讯、产品及技术。网址：www.eetop.cn bbs.eetop.cn

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

英伟达非唯一选择：苹果借助谷歌TPU成功训练大型模型！

EETOP · 公众号 · 硬件 · 2024-07-31 11:30

文章预览

苹果透露，它在开发最近发布的 Apple Intelligence 功能时并未使用 Nvidia 的硬件加速器。根据苹果官方的研究论文： machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf 苹果使用的是谷歌的 TPU 来处理训练数据，背后支持 Apple Intelligence 基础语言模型。配备谷歌TPUv4和TPUv5芯片的系统在创建Apple Foundation Models（AFMs）过程中发挥了重要作用。这些模型，包括AFM-server和AFM-on-device模型，旨在为在线和离线Apple Intelligence功能提供支持，这些功能在 2024 年 6 月的全球开发者大会（WWDC）上得到了广泛宣传。 AFM-server 是苹果最大的 LLM，因此它仅在线使用。根据最近发布的研究论文，苹果的 AFM-server 在 8,192 个 TPUv4 芯片上训练，“分配为 8 × 1,024 芯片切片，这些切片通过数据中心网络（DCN）连接在一起。”预训练是一个三阶段过程，首先使用 6.3T 的 tokens， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博