注册登录

专栏名称: 包包算法笔记

数据挖掘、机器学习、深度学习、Kaggle竞赛分享与交流。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

CHINADAILY · Business丨Tepid prices ... · 昨天

孙立平社会观察 · 孙立平：现在创造的财富够不够我们生活得轻松快 ... · 昨天

CHINADAILY · Business丨Steps afoot ... · 2 天前

团结湖参考 · “文科消亡论”中，真正值得担忧的是什么？ · 3 天前

今天看啥 › 专栏 › 包包算法笔记

DeepSeek-V3技术报告完整解读

包包算法笔记 · 公众号 · · 2025-01-05 09:05

文章预览

原文：https://zhuanlan.zhihu.com/p/14890557782 12月中旬，我浙之光Deepseek宣布完成了v2.5的最后一次升级之后，约过了十来天，v3.0就正式上线了。 DeepSeek-V3 是一款性能卓越的混合专家（MoE）语言模型，整体参数规模达到 671B，其中每个 token 激活的参数量为 37B 。评估结果表明，DeepSeek-V3 在性能上超越了其他开源模型，并能够与主流闭源模型相媲美。模型检查点已开放获取，地址为： https : //github.com/deepseek-ai/DeepSeek-V3 图1：DeepSeek-V3和竞品的各科目考分对比 *笔者会用GPTs翻译形成初稿，然后精读后完成终稿，力求每一句话自己都能理解后再输出译文。 *需要原文的请至文末跳转至原文链接阅读。引言近年来，LLM 经历了快速迭代和演进，逐步缩小了与通用人工智能（AGI）的差距。除了闭源模型外,开源模型阵营也在取得重大进展,包括 DeepSeek 系列、LL ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

CHINADAILY · Business丨Tepid prices spur call for demand uptick

昨天

孙立平社会观察 · 孙立平：现在创造的财富够不够我们生活得轻松快乐一点？

昨天

CHINADAILY · Business丨Steps afoot to spur domestic demand

2 天前

团结湖参考 · “文科消亡论”中，真正值得担忧的是什么？

3 天前

财宝宝 · 这次网络疯批的事情，会成为王家大院今后巨大的雷。 -20240812095103

5 月前

AI科技大本营 · Cursor 杀手来了！Claude 企业版原生集成 GitHub，即将开放给个人用户

4 月前

财经杂志 · 上市23年，茅台首次出手回购

3 月前

医药魔方Info · 国产GLP-1内卷的出口

昨天

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号