专栏名称: 瓦力算法学研所
我们是一个致力于分享人工智能、机器学习和数据科学方面理论与应用知识的公众号。我们将分享最新的人工智能和数据科学技术、案例、研究成果、新闻和趋势,以及如何应用这些技术来解决实际问题,探索每一项技术落地的可行性方案。
今天看啥  ›  专栏  ›  瓦力算法学研所

CCF2025 Talk “夜话DeepSeek:技术原理与未来方向“ 研讨会报告整理

瓦力算法学研所  · 公众号  ·  · 2025-02-10 08:00
    

文章预览

技术总结专栏 作者:喜欢卷卷的瓦力 CCF2025 Talk“夜话DeepSeek:技术原理与未来方向“线上研讨会总结与思考整理。 Deepseek已经爆火很久啦,比较细节的技术解读分享也比较多了,本篇就暂时不再赘述~ 2月2日晚CCF-Talk 举办的“夜话DeepSeek:技术原理与未来方向“线上研讨会上,五位高校老师都输出了很干的内容,本篇针对研讨会内容进行了总结和思考整理,方便大家进行速览。 下面是快捷目录。 一. o1 / DeepSeek-R1 对于AGI发展的影响 二. 对DeepSeek 训练方式的思考 三. 对DeepSeek 算法架构的思考 四. 大模型软硬件协同优化的思考 五. 总结  一. o1 / DeepSeek-R1 对于AGI发展的影响 1.  当前 “o1 模型的训练需要在强化学习的框架下进行,大语言模型充当了一个 Agent。每个动作其实就是生成下一个 token,最终生成整个 step 或者 solution。” 在这个框架下,模型需要考 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览