专栏名称: 非著名程序员
关注我(微博@涩郎),我与你闲扯技术大话,笑谈科技人生。上谈技术,下论产品,以幽默诙谐的态度,面对乏味无聊的技术,用扯淡的方式,分享产品的内涵。谈的是技术,是产品,更是我们的人生。做东半球最会思考,最有味道的互联网公众号。
今天看啥  ›  专栏  ›  非著名程序员

腾讯为什么支持开源?

非著名程序员  · 公众号  ·  · 2024-11-06 09:00

文章预览

今天看到一条新闻,感觉腾讯在 AI 大模型方面确实挺厉害的,符合它低调务实的风格,在不知不觉中一天竟然开源了两个核心的,重要的 AI 大模型。 据新闻报道,11月 5 日,腾讯混元宣布最新的 MoE 模型“混元 Large” 以及混元 3D 生成大模型正式开源。 同时,腾讯云TI平台和高性能应用服务 HAI 也于宣布开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。 简单介绍一下这两个大模型。 腾讯混元 Large 模型是基于 MoE 模型结构的,熟悉 AI 技术的同学应该知道,MoE(Mixture of Experts),即混合专家模型,是目前国内外主流的大模型结构,MoE 模型的每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型。 这次腾讯混元 Large 模型总参数量 389B,激活 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览