开源首秀就放大招！MiniMax 重磅更新两款大模型，业内首次大规模实现线性注意力机制

谈数据 · 公众号 · · 2025-01-22 09:08

文章预览

来源：InfoQ 全文共 3959 个字，建议阅读 5 分钟最近一段时间，中国大模型频频“刷屏”。前脚，DeepSeek V3 用 557.6 万美元的训练成本给海外大模型上了一课，后脚，MiniMax 就用两个开源大模型拿下“铁王座”。就在 MiniMax 宣布开源的前几日，黄仁勋在 CES 2025 上构造了一个 Agent 蓝图。可以说，Agent 作为大模型落地最有价值的路径，其潜力已经得到了全世界范围的广泛认可。而中国大模型的频频“刷屏”，也将为 Agent 的落地和爆发提供更多可能性。 01 MiniMax：新晋的全球顶级开源模型近日，MiniMax 宣布开源两款模型：基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。这是 MiniMax 的开源首秀，一出手，就是两个“王炸”：MiniMax-Text-01 在 4560 亿参数的规模上实现了线性注意力创新架构，单次激活参数 459 亿；MiniMax-VL-01 在 MiniMax-Text-01 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

91运营网 · 做小红书，请重点盯住这两个指标

14 小时前

运营研究社 · 小红书投放怎么做？这些资料一定要看

16 小时前

笔吧评测室 · 雷蛇首款垂直鼠标 Pro Click V2 Vertical Edition 发布：主打人体工学，119.99 美元

21 小时前

91运营网 · 91运营网vip会员早鸟票抢座ing！!

昨天

运营研究社 · 电商品牌一年卖2亿，如何“高人效”实现短视频批量生产？| 闭门分享预告

昨天

父母志 · 湖南12岁男孩确诊肺癌晚期，生活轨迹公开后，妈妈崩溃大哭：是我害了你！

6 月前

中国卫生杂志 · 哈尔滨：以数字化技术提升卫生健康行业治理水平

4 月前

DataEye短剧观察 · DataEye短剧热力榜：新剧占比70%，逆袭题材霸榜19席！爆款承制方揭秘！

4 月前

DataEye短剧观察 · DataEye短剧热力榜：新剧占比70%，逆袭题材霸榜19席！爆款承制方揭秘！

4 月前

合肥市场监管 · 合肥市春节期间药品安全平稳有序

2 月前