专栏名称: InfoQ
有内容的技术社区媒体。
今天看啥  ›  专栏  ›  InfoQ

“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能与DeepSeek V2.5相当

InfoQ  · 公众号  · 科技媒体  · 2025-03-26 18:35
    

文章预览

整理 | 华卫 近日,据外媒报道,中国金融科技巨头蚂蚁集团在人工智能领域取得了重大突破。有知情人士透露,蚂蚁集团使用由阿里巴巴和华为制造的国产芯片,开发出了将人工智能训练成本降低 20% 的方法。 据称,蚂蚁集团在训练“专家混合”(Mixture of Experts,以下简称 MoE)模型时运用了多种优化方法,在国产芯片的基础上取得了与使用英伟达 H800 等芯片差不多的训练效果:计算成本从 635 万元人民币 / 万亿 Token 降低至 508 万元人民币,但模型性能却能与 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相媲美。 这一消息引发了广泛关注,蚂蚁所带来的成果令海外的网友感到震惊。许多人纷纷发出感叹:“中国变化太快”、“美国禁止向中国供应芯片,只会让中国芯片制造业更快发展”、“这释放出一个强有力的信号:人工智能领域的主导地位并非英伟达 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览