专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

智谱版o1终于也来了:直接拿下考研数学,一句话就能做小游戏!

量子位  · 公众号  · AI  · 2024-12-31 09:43
    

主要观点总结

文章介绍了智谱版o1模型——GLM-Zero-Preview(Zero推理模型)的测试情况。包括其在数学、代码生成、视觉推理、加密问题等多维度的实测表现,以及智谱大模型矩阵的扩充情况。同时,文章还提及了智谱的技术发布时间轴和融资情况。

关键观点总结

关键观点1: Zero推理模型的数学能力测试

通过尝试不同类型的选择题和大题,Zero模型在解决数理问题上表现出了较强的能力,能够按照逻辑顺序拆解问题,给出正确答案。

关键观点2: Zero推理模型的代码生成能力测试

Zero模型能够根据要求生成代码,如制作贪吃蛇游戏、动态黑客帝国雨等,并且在将马斯克跳舞视频变成字符画方面也表现出了较强的能力。

关键观点3: Zero推理模型的其他能力测试

Zero模型在视觉推理、加密问题等方面也进行了测试,并与ChatGPT o1和DeepSeek V3等模型进行了比较。此外,Zero模型还能够根据数字与符号的关系推导符号表示,以及找出数字组合的最大值。

关键观点4: 智谱大模型的布局和技术发布情况

智谱发布了多款大模型产品,包括文本生成、图像生成、视频生成等。同时,智谱的技术发布时间轴非常密集紧凑,展示了其不断的技术创新和进步。

关键观点5: 智谱的融资和发展前景

智谱获得了30亿元的新一轮融资,估值超过200亿元。随着技术的不断发展和创新,智谱的发展前景备受期待。


文章预览

金磊 发自 凹非寺 量子位 | 公众号 QbitAI 终于,在2024年的最后一天, 智谱版o1 也来了! 名字叫做GLM-Zero-Preview, Zero推理模型 (下文简称Zero模型) ,自称是擅长通过逻辑推理来解决 数理问题 。 既然如此,那么我们就直接一套 2024年考研数学真题 来伺候一下吧~ 规则也很简单,就是把真题的题目以 截图 的方式“喂”给Zero模型,这样也可以顺便考验一下它的视觉理解能力。 例如我们小试牛刀地截取第一道 函数选择题 : 这道题怎么解? 从Zero模型生成的结果来看,主要分为 四大部分 : 读题审题 深度思考 解题步骤 最终答案 上下滑动查看所有内容: 有意思的是,Zero模型在深度思考过程中,它的思维方式像极了人类,而且每一步思考也描述的非常详细,最终给出了 正确答案:C 。 但同样的问题给到了ChatGPT o1……Emmm,先败在了“识图”这一步。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览