今天看啥  ›  专栏  ›  NLP工作站

Kimi发布最新模型k1.5,技术报告也干货满满

NLP工作站  · 公众号  ·  · 2025-01-21 00:00
    

文章预览

大家好,我是刘聪NLP。 就在今晚,Kimi发布了最新模型k1.5, 先来看榜单效果,简直爆炸 。 在长推理上,k1.5在数学能力上,无论是纯文本还是视觉多模态上,都远超openai的o1模型;在codeforces与其持平,LiveCode上略差,但相比于QVQ和QWQ有较大的优势。 在短推理上,k1.5的数学能力真实遥遥领先,无论是gpt-4o还是claude3.5-sonnet都远不如k1.5, 尤其是在AIME榜单上,k1.5有60.8,而最高的deepseek-v3只有39.2,堪称断层式碾压。 这个应该得益于他们的Long2short RL技术(后面介绍);并且k1.5在其他场景中大多都跟顶尖的开源和闭源模型打成平手。 有一说一,这次kimi的新模型有点东西的哈。 最重要的是kimi发了技术报告《 Kimi k1.5: Scaling Reinforcement Learning with Large Language Models 》,看了一下,25页,干货满满,他家针对强化学习,真的是做了好多工作,无论是data、strategy、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览