主要观点总结
杨植麟在京东科技大厦宣布Kimi数学模型k0-math正式发布,其数学能力对标OpenAI o1系列。k0-math从数学场景出发,通过强化学习的方法,具备深度思考的能力。在多项基准能力测试中,k0-math表现优异,未来会进一步泛化到更多任务上。杨植麟强调Kimi目前最核心的任务是提升留存,并认为强化学习是未来的重要技术趋势。
关键观点总结
关键观点1: Kimi数学模型k0-math发布
杨植麟宣布了Kimi的数学模型k0-math的正式发布,该模型具备强大的数学能力,可以对标OpenAI的o1系列模型。
关键观点2: 强化学习与深度思考
杨植麟强调,通过强化学习的方法,Kimi具备深度思考的能力,能够推理泛化到更多任务上。例如在数学场景中,通过大量的尝试和不同的解法组合,得出正确的答案。
关键观点3: k0-math在基准测试中的表现
在多项基准能力测试中,k0-math的数学能力表现优异,超过了OpenAI的o1-mini和o1-preview模型。特别是在竞赛级别的数学题库中,k0-math的表现也达到了很高的水平。
关键观点4: Kimi的核心任务与挑战
杨植麟认为Kimi目前最核心的任务是提升留存。他提到当下关于Scaling Laws的争辩,认为预训练和强化学习都是重要的方向,而未来的技术范式改变将带来更多的挑战和机遇。
关键观点5: 月之暗面的产品策略
杨植麟介绍了月之暗面的产品策略,他们主动做业务的减法,聚焦去做离AGI上限最高的事情。他强调了保持卡和人的比例的重要性,以及避免过度扩张以保持创新的优势。
文章预览
杨植麟:Kimi目前最核心的任务是提升留存。 作者丨张 进 编辑丨陈彩娴 今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标OpenAI o1系列,还公布了截止2024年10月 Kimi Chat 月活超过 3600万。 杨植麟称未来会更关注基于强化学习的方法去scale,不仅仅是简单地预测下一个token是什么,因为这是基于静态数据集,使得大模型不能完成更难的任务。在这个过程中,很重要的是让AI具备思考的能力。 用Next—Token prediction是做不到的,而用强化学习的方法一定程度上可以学习到这种思考的方式。例如解一道数学题,想要知道它的解题思路是怎样的,最后的结果是怎么一步步推导出来的,这就是一个深度思考的过程。 伽利略曾说,数学是宇宙的语言,所以数学场景是一个很广泛的应用场景,是培养 AI 具备思考能力
………………………………