专栏名称: 谈数据
聚焦数据治理,数字化转型,数据中台等领域专业知识总结和实战分享,做你身边最有价值的数据号!
今天看啥  ›  专栏  ›  谈数据

开源首秀就放大招!MiniMax 重磅更新两款大模型,业内首次大规模实现线性注意力机制

谈数据  · 公众号  ·  · 2025-01-22 09:08
    

文章预览

来源:InfoQ 全文共  3959  个字 ,建议阅读  5  分钟 最近一段时间,中国大模型频频“刷屏”。 前脚,DeepSeek V3 用 557.6 万美元的训练成本给海外大模型上了一课,后脚,MiniMax 就用两个开源大模型拿下“铁王座”。 就在 MiniMax 宣布开源的前几日,黄仁勋在 CES 2025 上构造了一个 Agent 蓝图。可以说,Agent 作为大模型落地最有价值的路径,其潜力已经得到了全世界范围的广泛认可。 而中国大模型的频频“刷屏”,也将为 Agent 的落地和爆发提供更多可能性。 01 MiniMax:新晋的全球顶级开源模型 近日,MiniMax 宣布开源两款模型:基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。 这是 MiniMax 的开源首秀,一出手,就是两个“王炸”:MiniMax-Text-01 在 4560 亿参数的规模上实现了线性注意力创新架构,单次激活参数 459 亿;MiniMax-VL-01 在 MiniMax-Text-01 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览