文章预览
最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注,慢思考模型通过生成长程的思考过程来解决更具挑战性的问题,在多个应用科学问答场景都取得了较大突破。 本次直播将聚焦大模型慢思考的基础技术与实现方法,对于Deepseek, Kimi可能涉及到的技术路径进行探索和系统性讲解,简要探讨推理模型的科学价值,并且总结现阶段推理模型的局限。 嘉宾简介 赵鑫,中国人民大学高瓴人工智能学院教授 ,研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用2.7万余次,曾主导研发了玉兰大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》以及《大语言模型》中文书。 重点分享内容 1. 推理模型简介 2. DeepSeek-R1技术实现 3. Kimi-K1.5技术实现 4. 推理模型的科学价值 5. 现阶段推理模型的局限 直播时间 直播时
………………………………