注册登录

专栏名称: NLP工作站

AIGC前沿知识分享&落地经验总结

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

数据中心运维管理 · UPS电池为什么容易着火,应怎么做好防火措施 · 昨天

Java基基 · 大厂最爱问的MVCC，到底是个啥？ · 昨天

数据中心运维管理 · 数据中心模块化机房建设空调与UPS电源安装施工方案 · 3 天前

AustinDatabases · 公众号给我两个数字 ... · 2 天前

AustinDatabases · 公众号给我两个数字 ... · 2 天前

今天看啥 › 专栏 › NLP工作站

Kimi发布最新模型k1.5，技术报告也干货满满

NLP工作站 · 公众号 · · 2025-01-21 00:00

文章预览

大家好，我是刘聪NLP。就在今晚，Kimi发布了最新模型k1.5，先来看榜单效果，简直爆炸。在长推理上，k1.5在数学能力上，无论是纯文本还是视觉多模态上，都远超openai的o1模型；在codeforces与其持平，LiveCode上略差，但相比于QVQ和QWQ有较大的优势。在短推理上，k1.5的数学能力真实遥遥领先，无论是gpt-4o还是claude3.5-sonnet都远不如k1.5，尤其是在AIME榜单上，k1.5有60.8，而最高的deepseek-v3只有39.2，堪称断层式碾压。这个应该得益于他们的Long2short RL技术（后面介绍）；并且k1.5在其他场景中大多都跟顶尖的开源和闭源模型打成平手。有一说一，这次kimi的新模型有点东西的哈。最重要的是kimi发了技术报告《 Kimi k1.5: Scaling Reinforcement Learning with Large Language Models 》，看了一下，25页，干货满满，他家针对强化学习，真的是做了好多工作，无论是data、strategy、 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

数据中心运维管理 · UPS电池为什么容易着火,应怎么做好防火措施

昨天

Java基基 · 大厂最爱问的MVCC，到底是个啥？

昨天

数据中心运维管理 · 数据中心模块化机房建设空调与UPS电源安装施工方案

3 天前

AustinDatabases · 公众号给我两个数字 34.6万，65.5万--告别2024

2 天前

AustinDatabases · 公众号给我两个数字 34.6万，65.5万--告别2024

2 天前

Lucy三娘财富之旅 · 头部证券，开户优惠

6 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号