专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

全球首个去中心化训练的10B级模型已正式开源,使用横跨三大洲的112块GPU训练而成

DeepTech深科技  · 公众号  · 科技媒体  · 2024-11-30 14:58
    

主要观点总结

文章介绍了在AI时代,算力成为核心竞争点,科技公司竞相投资计算资源。文章重点介绍了去中心化训练作为新的路径,通过聚合全球计算资源,使研究人员能够开发出先进模型。Prime Intellect推出的首个去中心化的10亿参数模型训练项目INTELLECT-1,展示了去中心化训练的潜力。该训练方法涉及模型的分布式特性和通信优化等方面。最后提到了该项目的未来规划和Prime Intellect公司的融资情况。

关键观点总结

关键观点1: AI时代算力的需求呈现指数级增长,成为科技公司的核心竞争点。

各大科技公司为了领先,投入大量资金建设算力中心,引发人们对AI发展路径的担忧。

关键观点2: 去中心化训练成为新的探索方向,通过聚合全球计算资源开发出先进模型。

Prime Intellect推出的INTELLECT-1项目展示了去中心化训练的潜力,使用OpenDiLoCo框架和Prime框架应对通信挑战。

关键观点3: 去中心化训练涉及模型的分布式特性和通信优化。

模型训练需要节点间的持续通信和大量信息交换,对节点的通信带宽要求极高。Prime Intellect通过减少节点间的通信需求和优化通信方式来解决这一问题。

关键观点4: INTELLECT-1项目的成功引起了行业的关注和投资。

Prime Intellect完成了种子轮融资,用于支持去中心化AI生态系统的建设,未来计划扩展到更大规模的模型训练。


文章预览

在 AI 时代,算力正在成为一种愈发重要的资源。 随着模型的规模和训练复杂度的不断提升,算力的需求也呈现出指数级的增长,它已成为各大科技公司争夺的核心竞争点。科技巨头们竞相投资计算资源,耗费上百亿美元建设算力中心,以此巩固自己在 AI 领域的领先地位。 图丨截止 2024 年 10 月,各大科技公司买入的 Nvdia H100 GPU 数量,据估计,H100 80GB 版本的单价在 30,000 至 40,000 美元之间。(来源:Visual Capitalist) 然而,这样的集中化趋势也带来了对未来的隐忧——模型训练的资源需求和集中化的控制权可能让 AI 技术的未来被少数大公司所垄断。这引发了人们对 AI 发展路径的深刻担忧。 在此背景下,一批研究者们正在尝试一条新的路径——去中心化训练,通过聚合全球计算资源,使研究人员能够通过跨集群的分布式训练协作开发出先进模型。 美 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览