专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

国产模型如何追上多模态OpenAI o1?你需要知道的全在这

PaperWeekly  · 公众号  · 科研  · 2025-01-22 12:02
    

文章预览

近年来,大模型技术竞争日趋白热化,OpenAI 的 GPT 系列和 Google 的 Gemini 等模型不断刷新行业标准。 近日,Kimi 团队发布了最新的多模态推理大模型 Kimi k1.5,性能追平 OpenAI 的 o1 模型正式版,并在多个推理任务上表现出色。更令人振奋的是,Kimi 团队首次公开了技术报告,详细介绍了模型的训练细节和核心技术。  毕业于斯坦福大学的英伟达知名科学家 Jim Fan 在海外社交平台对该模型不吝赞美: 推文的结尾 Jim 称赞本报告令人振奋,即便是假期,也值得一读。 为了推动技术社区的进步,Kimi 团队将 k1.5 的技术细节和训练方法完全公开: 报告地址 👇   https://github.com/MoonshotAI/kimi-k1.5   摘要: 语言模型通过下一个词预测进行预训练已被证明在计算扩展方面是有效的,但其受限于可用训练数据的数量。强化学习(RL)的扩展为人工智能的持续改进开辟了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览