注册
登录
专栏名称:
歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
中国药闻
·
“以旧换新”激发消费新活力
·
昨天
中国药闻
·
国家统计局:2024年四季度以来资本市场、房 ...
·
4 天前
中国药闻
·
年夜饭消费热气腾腾
·
5 天前
中国药闻
·
G2603次列车——乘着高铁看冰雪
·
5 天前
今天看啥
›
专栏
›
歸藏的AI工具箱
阿里昨晚开源了通义Qwen2模型,可以说是现阶段这个规模最强的开-20240607150046
歸藏的AI工具箱
·
微博
· · 2024-06-07 15:00
文章预览
2024-06-07 15:00 本条微博链接 阿里昨晚开源了通义Qwen2模型,可以说是现阶段这个规模最强的开源模型。 #ai# 发布后直接在 Huggingface LLM 开源模型榜单获得第一名,超过了刚发布的 Llama3 和一众开源模型。 Qwen2在代表推理能力的代码和数学以及长文本表现尤其突出。推理相关测试及大海捞针测试都取得了很好的成绩。 模型概览: Qwen 2 模型组成包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。其中Qwen2-57B-A14B为 MoE 模型 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
中国药闻
·
“以旧换新”激发消费新活力
昨天
中国药闻
·
国家统计局:2024年四季度以来资本市场、房地产市场出现积极变化
4 天前
中国药闻
·
年夜饭消费热气腾腾
5 天前
中国药闻
·
G2603次列车——乘着高铁看冰雪
5 天前
時間的玩家TimeIsArt
·
避免这2样食物,帮助你正确断食 |明天断食日
6 月前