主要观点总结
中国金融科技巨头蚂蚁集团在人工智能领域取得重大突破,使用由阿里巴巴和华为制造的国产芯片,降低了人工智能训练成本。蚂蚁集团开发的MoE(Mixture of Experts)模型在国产芯片上取得了与英伟达芯片相近的训练效果,引发了广泛关注。该团队面临大规模训练中的挑战,通过一系列系统优化策略实现了高效的LLM训练。同时,蚂蚁集团还强调了其开发的Ling系列MoE模型的性能优势。不过,尽管取得了这些成就,蚂蚁集团仍在使用英伟达的产品进行人工智能开发。
关键观点总结
关键观点1: 蚂蚁集团在人工智能领域取得重大突破
使用国产芯片降低了人工智能训练成本,引发了广泛关注
关键观点2: MoE模型的性能优势和创新策略
蚂蚁集团通过一系列创新策略优化了MoE模型的训练,提高了工作效率,并介绍了在过程中遇到的挑战和教训。
关键观点3: 蚂蚁集团开发的Ling系列MoE模型
Ling系列MoE模型在有限的资源和预算约束下训练的模型性能与前沿开源模型性能不相上下,展现了其强大的实力。
文章预览
整理 | 华卫 近日,据外媒报道,中国金融科技巨头蚂蚁集团在人工智能领域取得了重大突破。有知情人士透露,蚂蚁集团使用由阿里巴巴和华为制造的国产芯片,开发出了将人工智能训练成本降低 20% 的方法。 据称,蚂蚁集团在训练“专家混合”(Mixture of Experts,以下简称 MoE)模型时运用了多种优化方法,在国产芯片的基础上取得了与使用英伟达 H800 等芯片差不多的训练效果:计算成本从 635 万元人民币 / 万亿 Token 降低至 508 万元人民币,但模型性能却能与 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相媲美。 这一消息引发了广泛关注,蚂蚁所带来的成果令海外的网友感到震惊。许多人纷纷发出感叹:“中国变化太快”、“美国禁止向中国供应芯片,只会让中国芯片制造业更快发展”、“这释放出一个强有力的信号:人工智能领域的主导地位并非英伟
………………………………