专栏名称: 圆圆的算法笔记
定期更新深度学习/算法干货笔记和世间万物学习记录~
目录
相关文章推荐
今天看啥  ›  专栏  ›  圆圆的算法笔记

DeepSeek简明解析,10分钟速通DeepSeekV1~V3核心技术点!

圆圆的算法笔记  · 公众号  ·  · 2025-01-31 16:34
    

文章预览

点关注,不迷路,用心整理每一篇算法干货~ 后台留言” 交流 “, 加入圆圆算法交流群~ 扫码加入 系统 深入 学习时间序列知识 ( 已有 1000+ 同学加入学习, 800+ 干货笔记) 最近,DeepSeek在国际上很火,一方面其效果比肩非开源模型ChatGPT,另一方面其运行成本很低。可以说,DeepSeek是目前为止最先进的大模型之一。 今天这篇文章,就带大家梳理一下从2024年至今DeepSeek发布的V1版本到V3版本的核心技术点,看看DeepSeek采用了哪些技术构建了最先进的大模型,每一次的升级基本都伴随着训练数据的优化、模型结构的升级、优化方式的更新。 为了方便大家阅读,本文会用比较简洁的语言进行主要技术的介绍,一些其他相关的技术细节深度解析,后续也会陆续进行更新。 1 DeepSeek V1 DeepSeek V1是2024年1月份发布的第一版DeepSeek模型,包含DeepSeek的核心构建方式 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览