主要观点总结
文章介绍了智谱版o1模型——GLM-Zero-Preview(Zero推理模型)的测试情况。包括其在数学、代码生成、视觉推理、加密问题等多维度的实测表现,以及智谱大模型矩阵的扩充情况。同时,文章还提及了智谱的技术发布时间轴和融资情况。
关键观点总结
关键观点1: Zero推理模型的数学能力测试
通过尝试不同类型的选择题和大题,Zero模型在解决数理问题上表现出了较强的能力,能够按照逻辑顺序拆解问题,给出正确答案。
关键观点2: Zero推理模型的代码生成能力测试
Zero模型能够根据要求生成代码,如制作贪吃蛇游戏、动态黑客帝国雨等,并且在将马斯克跳舞视频变成字符画方面也表现出了较强的能力。
关键观点3: Zero推理模型的其他能力测试
Zero模型在视觉推理、加密问题等方面也进行了测试,并与ChatGPT o1和DeepSeek V3等模型进行了比较。此外,Zero模型还能够根据数字与符号的关系推导符号表示,以及找出数字组合的最大值。
关键观点4: 智谱大模型的布局和技术发布情况
智谱发布了多款大模型产品,包括文本生成、图像生成、视频生成等。同时,智谱的技术发布时间轴非常密集紧凑,展示了其不断的技术创新和进步。
关键观点5: 智谱的融资和发展前景
智谱获得了30亿元的新一轮融资,估值超过200亿元。随着技术的不断发展和创新,智谱的发展前景备受期待。
文章预览
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 终于,在2024年的最后一天, 智谱版o1 也来了! 名字叫做GLM-Zero-Preview, Zero推理模型 (下文简称Zero模型) ,自称是擅长通过逻辑推理来解决 数理问题 。 既然如此,那么我们就直接一套 2024年考研数学真题 来伺候一下吧~ 规则也很简单,就是把真题的题目以 截图 的方式“喂”给Zero模型,这样也可以顺便考验一下它的视觉理解能力。 例如我们小试牛刀地截取第一道 函数选择题 : 这道题怎么解? 从Zero模型生成的结果来看,主要分为 四大部分 : 读题审题 深度思考 解题步骤 最终答案 上下滑动查看所有内容: 有意思的是,Zero模型在深度思考过程中,它的思维方式像极了人类,而且每一步思考也描述的非常详细,最终给出了 正确答案:C 。 但同样的问题给到了ChatGPT o1……Emmm,先败在了“识图”这一步。
………………………………