专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

o1复现的一点点心得

AINLP  · 公众号  ·  · 2024-12-24 16:57
    

文章预览

知乎 :皓天 地址 :https://zhuanlan.zhihu.com/p/13872128423 编辑 :「深度学习自然语言处理」,转载请联系原作者 恰逢o3、gemini-flash-thinking版本推出,推理能力增强的模型已经把常见的benchmark刷到了一个遥不可及的结果,比如o3在aime24上直接干到29/30,code-force也刷到超过99.99%的人类。目前,推理模型主要在code、math、arg-agi等等上面有显著提升,而常用的翻译、对话等等场景,可能也用不到这么强的推理能力。可能真正能释放模型推理能力的场景是agent,由推理能力增强模型作为指挥家,调度一群不会思考只会工作的模型,降低推理成本 & 旧时代模型的合理利用(毕竟,直接把前代模型扔到垃圾桶,还是比较浪费钱)。 不管怎么样,我们也需要在现有资源下,掌握一定的推理模型构建方法论,才能在其他场景包括agent、tool等等场景持续优化和提升模型解决 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览