专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

DeepSeek R1和Kimi压箱底的RL撞车发布?! LLM-20250120224357

歸藏的AI工具箱  · 微博  ·  · 2025-01-20 22:43
    

文章预览

2025-01-20 22:43 本条微博链接 DeepSeek R1和Kimi压箱底的RL撞车发布?! LLM小春晚吗? 月至暗面发布了他们的多模态推理模型 k1.5,也首次公开了模型的训练技术报告 在short-CoT方面达到领先水平,多个测试中大幅超越GPT-4和Claude Sonnet 3.5 在多个领域的Long-CoT表现与O1级别持平 #AI创造营# #ai# 他们主要通过下面几个方法完成了K1.5的训练: - 长上下文扩展: 通过将RL的上下文窗口扩展到128k,观察到随着上下文长度的增加,性能持续提 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览