分享最新一线AI大模型、云原生、智能算力架构技术
今天看啥  ›  专栏  ›  AI云原生智能算力架构

深度解读DeepSeek架构:原理与效应 2025

AI云原生智能算力架构  · 公众号  ·  · 2025-03-05 07:15
    

文章预览

欢迎关注 生成式 AI : 2014 —— 2024 生成式 AI :  使用生成式模型生成 各类数据 (语言、语音、图片、视频等) Attention :  数据依存关系建模 Transformer :  数据生成的统一架构 Scaling Laws :  数据学习、生成的扩展法则 RLHF :  生成与人类价值对齐的数据 o1/R1 :  生成式求解问题——生成问题求解的过程和答案(推理) 自然语言处理与语言模型 自然语言处理:  人类语言的智能化 ,简 处理与分析,使计算机具备听、说、 读、写、译等人所具备的语言能力 语言模型: 自然语言统计建模,简单说,就是预测句子中的下一个单词是什么。 大语言模型: 2018 —— 2024 大语言模型:技术栈 大语言模型:生命周期与范式 扩展法则 大语言模型:后训练范式 推理语言模型? DeepSeek : 2023 —2025 DeepSeek :技术创新——模型架构  | V2 DeepSeek :技术创新——模型架构 | V2 DeepSeek :技术创新— ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览