主要观点总结
文章介绍了国产AI模型提供商智谱推出的首个免费多模态API——GLM-4V-Flash,并将其与GPT-4o mini进行了对比测试。测试涵盖了多种场景,包括看图猜成语、世界知识储备、物体计数、表情包理解、拍照解题、字体识别、情绪理解、复合物体理解、自动驾驶场景和物流单据OCR信息抽取等。结果显示,GLM-4V-Flash在效果上与GPT-4o mini不分伯仲,甚至在一些中文特色场景表现更好,而且响应速度更快。智谱今年8月份和时隔四个月后再次免费开放模型,体现了其普惠大众的理念。文章呼吁用户不再被OpenAI薅羊毛,转而体验智谱的模型。
关键观点总结
关键观点1: 智谱推出首个免费多模态API——GLM-4V-Flash
文章介绍了国产AI模型提供商智谱推出的首个免费多模态API GLM-4V-Flash,并详细介绍了其功能和特点。
关键观点2: GLM-4V-Flash与GPT-4o mini的对比测试
文章将GLM-4V-Flash与GPT-4o mini进行了对比测试,涉及多种场景,包括看图猜成语、世界知识储备等。
关键观点3: GLM-4V-Flash表现优秀
测试结果显示,GLM-4V-Flash在效果上与GPT-4o mini不分伯仲,甚至在一些中文特色场景表现更好,而且响应速度更快。
关键观点4: 智谱多次免费开放模型
智谱今年8月份和时隔四个月后再次免费开放模型,体现了其普惠大众的理念,让重要技术无负担落地,造福用户和应用开发者。
关键观点5: 呼吁体验智谱的模型
文章呼吁用户不再被OpenAI薅羊毛,转而体验智谱的模型,并提供了直接体验的方式。
文章预览
OpenAI 连续 12 天的深夜直播,直接给 AI 圈干懵了。每天一边疯狂,一边感觉身体在被掏空…… 12 天的炮弹攻击,搞得其他厂商都不敢有动静了。但是,我今天发现国产「AI 卷王」智谱悄悄地在公众号里发了篇推文—— 首个免费多模态 API:GLM-4V-Flash 上线智谱开放平台 纳尼?!我还以为是我这两天熬夜肝出幻觉来了。 视觉对话的 API 也能搞免费? 玩过 ChatBot API 的都知道,多模态/视觉类的 API 都非常的贵。 就算号称白菜价的 GPT-4o mini,调用视觉理解能力的时候,一张图片都会消耗 5 分钱。钱包根本扛不住大规模部署/调用。 视觉能力对标 GPT-4o mini 模型的 GLM-4V-Flash,智谱竟然上线即免费? 智谱,我斑愿称你为最卷。 我先把测试传送门贴出来,等不及的小伙伴直接传送: 传送门:https://bigmodel.cn?utm_source=xixiaoyao _campaign=4vflash & _channel_track_key=iOwaTIbN 说
………………………………