腾讯混元宣布开源2个大模型！Meta发布带隐藏结构的规模定律研究....

AI for Research · 公众号 · · 2024-11-05 20:38

文章预览

前言：平淡无奇的一天又来了，今天要分享的内容主要是关于大模型、大语言模型、预训练的，喜欢的小伙伴赶紧去阅读相关论文吧。 1. 腾讯的Hunyuan-Large:目前最大的开源Transformer混合专家模型标题： Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent 机构：腾讯关键词： Hunyuan-Large、混合专家模型、Transformer 作者： Xingwu Sun, Yanfeng Chen, Yiqing Huang 分析：在这篇论文中，该论文介绍了Hunyuan-Large,它是目前最大的开源Transformer基混合专家模型，拥有3890亿个参数和520亿个激活参数，能够处理高达256K的标记。该论文在各种基准测试中对Hunyuan-Large的优越性能进行了全面的评估，包括语言理解和生成、逻辑推理、数学问题解决、编码、长上下文以及汇总任务，在这些任务中，它优于LLama3.1-70B并与显著更大的LLama3.1-405B模型表 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

秦皇岛晚报 · 长图丨传统古村落、美丽渔村、康养民宿……8条精品路线邀你“乡”约河北！

1小时前

秦皇岛晚报 · 长图丨传统古村落、美丽渔村、康养民宿……8条精品路线邀你“乡”约河北！

1小时前

河北青年报 · 破2亿元！河北还有个好消息

2 天前

河北青年报 · 破2亿元！河北还有个好消息

2 天前

河北卫视 · 《走遍河北》特别策划《凤栖太行》系列节目：羊绒为媒深耕太行

2 天前

国浩律师事务所 · 国浩荣登2024 ALB China区域市场排名：西部地区律所

6 月前

毛有话说 · 箴言

2 月前

秋叶PPT · 郑钦文代言翻车！这张广告图，被网友骂惨了……

1 月前

安徽商报 · 单位员工用工作截图送人情，被行政警告！

2 周前

财宝宝 · 多多也是虎狼之年啊！//@财多多-多多:大器晚成？//@财宝宝:-20250118211034

3 天前